Predicción de concentraciones de PM2.5 y PM10 utilizando los algoritmos XGboost y LightGBM: un estudio de caso en Lima, Perú
Resumen
La contaminación del aire es un problema importante que afecta tanto a la salud humana como al medio ambiente, causando millones de muertes prematuras anualmente en todo el mundo y degradando severamente el estado del planeta. La exposición a material particulado fino, altamente peligroso, permite que estas partículas penetren profundamente en los pulmones y provoquen problemas de salud graves, incluyendo una reducción en la esperanza de vida de más de dos años. En respuesta a este problema, es crucial identificar formas efectivas de monitorear los niveles de estos contaminantes en nuestro entorno diario. Este artículo presenta un estudio de caso realizado en el distrito de San Borja, Lima, Perú, donde se implementaron modelos de predicción para PM2,5 y PM10 utilizando los algoritmos XGBoost y LightGBM. Empleando datos del portal del SENAMHI y un análisis de correlación de variables, se desarrollaron dos escenarios diferentes para el entrenamiento de los modelos. En el escenario 1, se entrenaron modelos de predicción para PM2,5 y PM10 utilizando todas las variables meteorológicas y de contaminación disponibles. En el escenario 2, los modelos se entrenaron para PM2,5 excluyendo la variable PM10, y viceversa. Los resultados mostraron que ambos modelos lograron una alta precisión, medida por el coeficiente de determinación, sin diferencias estadísticamente significativas que indicaran la superioridad de alguno de los modelos. Además, el análisis de los escenarios propuestos reveló que excluir variables clave puede resultar en predicciones significativamente menos precisas, lo que podría comprometer la efectividad de las estrategias de gestión ambiental.
Descargas
Citas
Ameer, S., Shah, M, A., Khan, A., Song, H., Maple, C., Islam, S. U., & Asghar, M. N. (2019). Comparative analysis of machine learning techniques for predicting air quality in smart cities, IEEE Access, 7, 128325–128338. https://doi,org/10,1109/ACCESS,2019,2925082
Ayus, I., Natarajan, N. & Gupta, D. (2023). Comparison of machine learning and deep learning techniques for the prediction of air pollution: a case study from China, Asian Journal of Atmospheric Environment, 17, Article 4. https://doi,org/10,1007/s44273-023-00005-w
Bai, Y., Li, Y., Wang, X., Xie, J., & Li, C. (2016). Air pollutants concentrations forecasting using back propagation neural network based on wavelet decomposition with meteorological conditions, Atmospheric Pollution Research, 7(3), 557–566. https://doi,org/10,1016/j,apr,2016,01,004
Cordova, C. H., Portocarrero, M. N. L., Salas, R., Torres, R., Canas, P., & López-Gonzales J. L. (2021). Air quality assessment and pollution forecasting using artificial neural networks in Metropolitan Lima-Peru, Scientific Reports, 11, Article 24232. https://doi,org/10,1038/s41598-021-03650-9
Gokul, P. R., Mathew, A., Bhosale, A., & Nair, A. T. (2023). Spatio-temporal air quality
analysis and PM2,5 prediction over Hyderabad City, India using artificial
intelligence techniques, Ecological Informatics, 76, Article 102067. https://
doi,org/10,1016/j,ecoinf,2023,102067
Gryech, I., Ghogho, M., Elhammouti, H., Sbihi, N., & Kobbane, A. (2020). Machine learning
for air quality prediction using meteorological and traffic related features,
Journal of Ambient Intelligence and Smart Environments, 12(5), 379–391. https://
doi,org/10,3233/AIS-200572
Liang, Y-C., Maimury, Y., Chen, A. H-L., & Juarez, J. R. C. (2020). Machine learningbased
prediction of air quality, Applied Sciences, 10(24), Article 9151. https://
doi,org/10,3390/app10249151
Liu, X., Zhao, K., Liu, Z., & Wang, L. (2023). PM2,5 Concentration Prediction Based on LightGBM
Optimized by Adaptive Multi-Strategy Enhanced Sparrow Search Algorithm,
Atmosphere, 14(11), Article 1612. https://doi,org/10,3390/atmos14111612
Martín-Baos, J. Á., Rodriguez-Benitez, L., García-Ródenas, R., & Liu, J. (2022). IoT based
monitoring of air quality and traffic using regression analysis, Applied Soft
Computing, 115, Article 108282. https://doi,org/10,1016/j,asoc,2021,108282
Ministerio del Ambiente. (2021). Plan de acción para la calidad del aire en Lima y Callao.
https://cdn.www.gob.pe/uploads/document/file/2090922/PAMCA_Lima-
Callao.pdf.pdf?v=1629305191
Pan, B. (2018). Application of XGBoost algorithm in hourly PM2,5 concentration prediction,
IOP Conference Series: Earth and Environmental Science, 113, Article 012127.
https://doi,org/10,1088/1755-1315/113/1/012127
Pan American Health Organization. (2016). Annual report 2016. https://www.paho.org/
annual-report-2016/index.html
Servicio Nacional de Meteorología e Hidrología del
Perú. (2024). Monitoreo de la Calidad de Aire, para Lima Metropolitana.
https://www,senamhi,gob,pe/?p=calidad-del-aire-estacion&e=112194
Shakya, D., Deshpande, V., Goyal, M. K., & Agarwal, M. (2023). PM2,5 air pollution
prediction through deep learning using meteorological, vehicular, and emission
data: A case study of New Delhi, India, Journal of Cleaner Production, 427, Article
https://doi,org/10,1016/j,jclepro,2023,139278
Sloss, L. L., & Smith, I. M. (2000). PM10 and PM2.5: An international perspective.
Fuel Processing Technology, 65-66, 127–141. https://doi.org/10.1016/
S0378-3820(99)00081-8
Sulaimon, I. A., Alaka, H., Olu-Ajayi, R., Ahmad, M., Ajayi, S. & Hye, A. (2022). Effect of
traffic data set on various machine-learning algorithms when forecasting air
quality, Journal of Engineering, Design and Technology, 22(3), 1030–1056.
https://doi,org/10,1108/JEDT-10-2021-0554
Wang, Z., Chen, P., Wang, R., An, Z., & Qiu, L. (2023). Estimation of PM2,5 concentrations
with high spatiotemporal resolution in Beijing using the ERA5 dataset and
machine learning models, Advances in Space Research, 71(8), 3150–3165.
https://doi,org/10,1016/j,asr,2022,12,016
World Health Organization. (2021). WHO global air quality guidelines: particulate matter
(PM2,5 and PM10), ozone, nitrogen dioxide, sulfur dioxide and carbon monoxide.
https://apps,who,int/iris/handle/10665/345329
World Health Organization. (2022). Air pollution. https://www,who,int/health-topics/
air-pollution#tab=tab_1
Yang, W., Deng, M., Xu, F., & Wang, H. (2018). Prediction of hourly PM2,5 using a spacetime
support vector regression model, Atmospheric Environment, 181, 12–19.
https://doi,org/10,1016/j,atmosenv,2018,03,015
Zhang, D., & Woo, S. S. (2020). Real time localized air quality monitoring and prediction
through mobile and fixed IoT sensing network, IEEE Access, 8, 89584–89594.
https://doi,org/10,1109/ACCESS,2020,2993547
Zhang, K., Yang, X., Cao, H., Thé, J., Tan, Z., & Yu, H. (2023). Multi-step forecast of PM2,5
and PM10 concentrations using convolutional neural network integrated with
spatial–temporal attention and residual learning, Environment International,
, Article 107691. https://doi,org/10,1016/j,envint,2022,107691
Esta obra está bajo licencia internacional Creative Commons Reconocimiento 4.0.
Los autores/as que publiquen en esta revista aceptan las siguientes condiciones:
Los autores/as conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la licencia de atribución de Creative Commons, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.
Los autores/as pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.
Se permite y recomienda a los autores/as a publicar su trabajo en Internet (por ejemplo en páginas institucionales o personales) antes y durante el proceso de revisión y publicación, ya que puede conducir a intercambios productivos y a una mayor y más rápida difusión del trabajo publicado (vea The Effect of Open Access).
Última actualización: 03/05/21