Predicción de concentraciones de PM2.5 y PM10 utilizando los algoritmos XGboost y LightGBM: un estudio de caso en Lima, Perú

Palabras clave: contaminación del aire, calidad del aire, datos meteorológicos, aprendizaje automático, XGBoost, LightGBM

Resumen

La contaminación del aire es un problema importante que afecta tanto a la salud humana como al medio ambiente, causando millones de muertes prematuras anualmente en todo el mundo y degradando severamente el estado del planeta. La exposición a material particulado fino, altamente peligroso, permite que estas partículas penetren profundamente en los pulmones y provoquen problemas de salud graves, incluyendo una reducción en la esperanza de vida de más de dos años. En respuesta a este problema, es crucial identificar formas efectivas de monitorear los niveles de estos contaminantes en nuestro entorno diario. Este artículo presenta un estudio de caso realizado en el distrito de San Borja, Lima, Perú, donde se implementaron modelos de predicción para PM2,5 y PM10 utilizando los algoritmos XGBoost y LightGBM. Empleando datos del portal del SENAMHI y un análisis de correlación de variables, se desarrollaron dos escenarios diferentes para el entrenamiento de los modelos. En el escenario 1, se entrenaron modelos de predicción para PM2,5 y PM10 utilizando todas las variables meteorológicas y de contaminación disponibles. En el escenario 2, los modelos se entrenaron para PM2,5 excluyendo la variable PM10, y viceversa. Los resultados mostraron que ambos modelos lograron una alta precisión, medida por el coeficiente de determinación, sin diferencias estadísticamente significativas que indicaran la superioridad de alguno de los modelos. Además, el análisis de los escenarios propuestos reveló que excluir variables clave puede resultar en predicciones significativamente menos precisas, lo que podría comprometer la efectividad de las estrategias de gestión ambiental.

Descargas

La descarga de datos todavía no está disponible.

Citas

Ameer, S., Shah, M, A., Khan, A., Song, H., Maple, C., Islam, S. U., & Asghar, M. N. (2019). Comparative analysis of machine learning techniques for predicting air quality in smart cities, IEEE Access, 7, 128325–128338. https://doi,org/10,1109/ACCESS,2019,2925082

Ayus, I., Natarajan, N. & Gupta, D. (2023). Comparison of machine learning and deep learning techniques for the prediction of air pollution: a case study from China, Asian Journal of Atmospheric Environment, 17, Article 4. https://doi,org/10,1007/s44273-023-00005-w

Bai, Y., Li, Y., Wang, X., Xie, J., & Li, C. (2016). Air pollutants concentrations forecasting using back propagation neural network based on wavelet decomposition with meteorological conditions, Atmospheric Pollution Research, 7(3), 557–566. https://doi,org/10,1016/j,apr,2016,01,004

Cordova, C. H., Portocarrero, M. N. L., Salas, R., Torres, R., Canas, P., & López-Gonzales J. L. (2021). Air quality assessment and pollution forecasting using artificial neural networks in Metropolitan Lima-Peru, Scientific Reports, 11, Article 24232. https://doi,org/10,1038/s41598-021-03650-9

Gokul, P. R., Mathew, A., Bhosale, A., & Nair, A. T. (2023). Spatio-temporal air quality

analysis and PM2,5 prediction over Hyderabad City, India using artificial

intelligence techniques, Ecological Informatics, 76, Article 102067. https://

doi,org/10,1016/j,ecoinf,2023,102067

Gryech, I., Ghogho, M., Elhammouti, H., Sbihi, N., & Kobbane, A. (2020). Machine learning

for air quality prediction using meteorological and traffic related features,

Journal of Ambient Intelligence and Smart Environments, 12(5), 379–391. https://

doi,org/10,3233/AIS-200572

Liang, Y-C., Maimury, Y., Chen, A. H-L., & Juarez, J. R. C. (2020). Machine learningbased

prediction of air quality, Applied Sciences, 10(24), Article 9151. https://

doi,org/10,3390/app10249151

Liu, X., Zhao, K., Liu, Z., & Wang, L. (2023). PM2,5 Concentration Prediction Based on LightGBM

Optimized by Adaptive Multi-Strategy Enhanced Sparrow Search Algorithm,

Atmosphere, 14(11), Article 1612. https://doi,org/10,3390/atmos14111612

Martín-Baos, J. Á., Rodriguez-Benitez, L., García-Ródenas, R., & Liu, J. (2022). IoT based

monitoring of air quality and traffic using regression analysis, Applied Soft

Computing, 115, Article 108282. https://doi,org/10,1016/j,asoc,2021,108282

Ministerio del Ambiente. (2021). Plan de acción para la calidad del aire en Lima y Callao.

https://cdn.www.gob.pe/uploads/document/file/2090922/PAMCA_Lima-

Callao.pdf.pdf?v=1629305191

Pan, B. (2018). Application of XGBoost algorithm in hourly PM2,5 concentration prediction,

IOP Conference Series: Earth and Environmental Science, 113, Article 012127.

https://doi,org/10,1088/1755-1315/113/1/012127

Pan American Health Organization. (2016). Annual report 2016. https://www.paho.org/

annual-report-2016/index.html

Servicio Nacional de Meteorología e Hidrología del

Perú. (2024). Monitoreo de la Calidad de Aire, para Lima Metropolitana.

https://www,senamhi,gob,pe/?p=calidad-del-aire-estacion&e=112194

Shakya, D., Deshpande, V., Goyal, M. K., & Agarwal, M. (2023). PM2,5 air pollution

prediction through deep learning using meteorological, vehicular, and emission

data: A case study of New Delhi, India, Journal of Cleaner Production, 427, Article

https://doi,org/10,1016/j,jclepro,2023,139278

Sloss, L. L., & Smith, I. M. (2000). PM10 and PM2.5: An international perspective.

Fuel Processing Technology, 65-66, 127–141. https://doi.org/10.1016/

S0378-3820(99)00081-8

Sulaimon, I. A., Alaka, H., Olu-Ajayi, R., Ahmad, M., Ajayi, S. & Hye, A. (2022). Effect of

traffic data set on various machine-learning algorithms when forecasting air

quality, Journal of Engineering, Design and Technology, 22(3), 1030–1056.

https://doi,org/10,1108/JEDT-10-2021-0554

Wang, Z., Chen, P., Wang, R., An, Z., & Qiu, L. (2023). Estimation of PM2,5 concentrations

with high spatiotemporal resolution in Beijing using the ERA5 dataset and

machine learning models, Advances in Space Research, 71(8), 3150–3165.

https://doi,org/10,1016/j,asr,2022,12,016

World Health Organization. (2021). WHO global air quality guidelines: particulate matter

(PM2,5 and PM10), ozone, nitrogen dioxide, sulfur dioxide and carbon monoxide.

https://apps,who,int/iris/handle/10665/345329

World Health Organization. (2022). Air pollution. https://www,who,int/health-topics/

air-pollution#tab=tab_1

Yang, W., Deng, M., Xu, F., & Wang, H. (2018). Prediction of hourly PM2,5 using a spacetime

support vector regression model, Atmospheric Environment, 181, 12–19.

https://doi,org/10,1016/j,atmosenv,2018,03,015

Zhang, D., & Woo, S. S. (2020). Real time localized air quality monitoring and prediction

through mobile and fixed IoT sensing network, IEEE Access, 8, 89584–89594.

https://doi,org/10,1109/ACCESS,2020,2993547

Zhang, K., Yang, X., Cao, H., Thé, J., Tan, Z., & Yu, H. (2023). Multi-step forecast of PM2,5

and PM10 concentrations using convolutional neural network integrated with

spatial–temporal attention and residual learning, Environment International,

, Article 107691. https://doi,org/10,1016/j,envint,2022,107691

Publicado
2024-12-26
Cómo citar
Oblitas Mantilla, J. A., & Escobedo Cárdenas, E. J. (2024). Predicción de concentraciones de PM2.5 y PM10 utilizando los algoritmos XGboost y LightGBM: un estudio de caso en Lima, Perú. Interfases, (020), 183-206. https://doi.org/10.26439/interfases2024.n020.7417
Sección
Artículos de investigación