Clasificación automatizada de superficies
citrícolas mediante SVM y patrones
temporales de NDVI: Aplicaciones para
agricultura de precisión y gestión logística
Fabiola Sánchez-Galván
https://orcid.org/0000-0002-6534-3210
fabiola.sanchez@itsta.edu.mx
Tecnológico Nacional de México, campus Instituto Tecnológico
Superior de Tantoyuca
Rogelio García-Rodríguez
https://orcid.org/0000-0003-1526-4087
Tecnológico Nacional de México, campus Instituto Tecnológico
Superior de Tantoyuca
Paulino Salas Martínez
https://orcid.org/0009-0004-8118-3052
m223s0011@itsta.edu.mx
Tecnológico Nacional de México, campus Instituto Tecnológico
Superior de Tantoyuca
María Xóchitl Altamirano Herrera
https://orcid.org/0009-0005-0742-2825
xochitl.altamirano@itsta.edu.mx
Tecnológico Nacional de México, campus Instituto Tecnológico
Superior de Tantoyuca
Horacio Bautista-Santos
https://orcid.org/0000-0002-3925-2438
horacio.bautista@itsta.edu.mx
Tecnológico Nacional de México, campus Instituto Tecnológico
Superior de Tantoyuca
Recibido: 10 de abril del 2025 / Aprobado: 15 de mayo del 2025
doi: https://doi.org/10.26439/interfases2025.n021.7858
RESUMEN. Este estudio desarrolló un modelo basado en máquinas de vectores de soporte (support vector machines, SVM) y series temporales del índice de vegetación de diferencia normalizada (normalized difference vegetation index, NDVI) para clasificar superficies citrícolas en Álamo, Veracruz, México. Se utilizaron imágenes MODIS (MOD13Q1, 250 m de resolución) de 2003 a 2022, procesadas mediante corrección radiométrica, filtrado de ruido y armonización temporal. Las zonas de entrenamiento se clasificaron en cuatro categorías (cítricos, vegetación natural, pastizales y áreas urbanas) y se utilizaron 3759 series temporales (50 % positivas para cítricos). El modelo SVM (kernel RBF: γ = 0,1, C = 10) alcanzó una precisión del 91,4 % mediante validación cruzada (cinco pliegues), con un 88 % de acierto en cítricos y 93,9 % en no cítricos. Los resultados mostraron un NDVI promedio de 0,74 para cítricos, diferenciable de la maleza (0,87), aunque con desafíos en parcelas pequeñas debido a la resolución espacial. Las estimaciones coincidieron con datos oficiales (SIACON) en 2021 (diferencia de 548 ha), aunque presentaron discrepancias en años con sequías (2007 y 2015) o cambios de manejo (2019 y 2020). Se identificó que factores climáticos y antropogénicos afectan la dinámica del NDVI, lo que evidencia la utilidad del modelo para monitoreo agrícola. Las limitaciones incluyen mezcla de píxeles en áreas heterogéneas. Este trabajo demuestra que el enfoque SVM-NDVI es robusto para la clasificación de superficies citrícolas a escala regional con aplicaciones potenciales en gestión logística, como la optimización de rutas de transporte y la planificación de cosechas mediante patrones espaciotemporales de NDVI. Estos hallazgos abren oportunidades para integrar teledetección y aprendizaje automático en cadenas de suministro agrícola sostenibles.
PALABRAS CLAVE: cadenas de suministro agrícolas sostenibles / agricultura de precisión / agrologística
AUTOMATED CLASSIFICATION OF CITRUS AREAS USING SVM AND NDVI TEMPORAL PATTERNS: APPLICATIONS FOR PRECISION AGRICULTURE AND LOGISTICS MANAGEMENT
ABSTRACT. This study developed a model based on Support Vector Machines (SVM) and Normalized Difference Vegetation Index (NDVI) time series to classify citrus areas in Álamo, Veracruz, Mexico. MODIS images (MOD13Q1, 250 m resolution) from 2003 to 2022 were used, processed using radiometric correction, noise filtering, and temporal harmonization. Training areas were classified into four categories: citrus, natural vegetation, grasslands, and urban areas, using 3,759 time series, 50 % of which were positive for citrus. The SVM model (RBF kernel: γ = 0.1, C = 10) achieved an accuracy of 91.4 % using 5-fold cross-validation, with 88% success in citrus and 93.9 % in non-citrus samples. The results showed an average NDVI of 0.74 for citrus, distinguishable from weeds (0.87), although with challenges in small plots due to spatial resolution. The estimates coincided with official data (SIACON) in 2021 (548 ha difference), although they presented discrepancies in years with droughts (2007, 2015) or management changes (2019-2020). Climatic and anthropogenic factors were identified as affecting NDVI dynamics, demonstrating the model’s usefulness for agricultural monitoring. Limitations include pixel mixing in heterogeneous areas. This work demonstrates that the SVM-NDVI approach is robust for classifying citrus areas at a regional scale, with potential applications in logistics management, such as transport route optimization and crop planning using spatiotemporal NDVI patterns. These findings open up opportunities to integrate remote sensing and machine learning into sustainable agricultural supply chains.
KEYWORDS: sustainable agricultural supply chains / precision agriculture / agrologistics
INTRODUCCIÓN
Los cítricos representan uno de los cultivos frutícolas más importantes a nivel mundial, tanto por su valor económico como nutricional. México ocupa el quinto lugar como productor global, destacando en variedades como naranja (4 600 000 toneladas), limón (2 900 000 toneladas) y toronja (490 000 toneladas) (Servicio Nacional de Sanidad, Inocuidad y Calidad Agroalimentaria, 2022). A nivel nacional, el estado de Veracruz concentra el 75 % de la superficie cosechada de naranja con un valor de producción que supera los MXN 2 300 000 en el municipio de Álamo Temapache (Dirección General del Servicio de Información Agroalimentaria y Pesquera, 2023). Este cultivo no solo sustenta la economía local, sino que también enfrenta desafíos críticos, como la variabilidad climática y plagas, las cuales requieren métodos precisos de monitoreo para optimizar su manejo.
Tradicionalmente, la estimación de superficies agrícolas ha dependido de censos presenciales, métodos costosos y de baja frecuencia. Sin embargo, la teledetección satelital, combinada con técnicas de aprendizaje automático, emerge como una alternativa eficiente. Estudios recientes han demostrado el potencial del índice de vegetación de diferencia normalizada (NDVI) para mapear coberturas vegetales (Kadhim et al., 2022, Khare et al., 2019), predecir sequías (Aguilar Lome, 2021; Choubin et al., 2019) e, incluso, caracterizar ciclos fenológicos (Testa et al., 2018). No obstante, su aplicación específica en cultivos citrícolas enfrenta limitaciones, como la resolución espacial moderada1 y la confusión espectral con malezas o vegetación natural (Girimonte & García, 2020), lo que reduce la precisión en estimaciones de superficie.
La teledetección ha revolucionado el monitoreo agrícola a través del NDVI, lo que ha demostrado su eficacia en aplicaciones como la evaluación de cobertura vegetal: las series temporales de NDVI han permitido mapear con precisión cambios en humedales (Mu et al., 2020) y bosques (Novo-Fernández et al., 2018). Este índice también facilita el análisis espaciotemporal para identificar patrones de crecimiento vegetal (Measho et al., 2019) y caracterizar fenologías de cultivos (Testa et al., 2018), donde sensores como MODIS han mostrado especial eficacia para seguimientos multianuales (Nolasco et al., 2023; Zúñiga-Vásquez et al., 2020).
En el ámbito de la agricultura de precisión, la teledetección combina NDVI y el aprendizaje automático para predecir sequías (Choubin et al., 2019) e identificar cultivos deteriorados (Girimonte et al., 2020). La integración con índices, como el índice de vegetación mejorado (enhanced vegetation index, EVI), mejora el análisis climático (Figueira Branco et al., 2019). Los sistemas de visión artificial aumentan la exactitud en estimaciones de rendimiento (Bautista et al., 2018).
En este artículo se propone un modelo basado en máquinas de vectores de soporte (SVM) y series temporales de NDVI (2003-2022) para estimar hectáreas citrícolas en el municipio de Álamo Temapache, en el que se abordan tres etapas clave: clasificación precisa (diferenciación de cultivos citrícolas frente a otras coberturas vegetales mediante patrones temporales de NDVI), validación robusta (uso de datos oficiales2 para cuantificar la precisión del modelo en un periodo de veinte años) y análisis de anomalías (identificación de factores externos, como las sequías y la pandemia de COVID-19, que han impactado la dinámica del NDVI). Aunque el SVM utilizado pertenece al módulo de machine learning de MATLAB y comparte principios de optimización con algunas arquitecturas de redes neuronales, su enfoque se centra en la maximización del margen entre clases mediante hiperplanos, lo que lo distingue de modelos basados en capas neuronales.
Este enfoque integral representa un avance significativo en la agricultura de precisión para cultivos perennes. También plantea que la clasificación automatizada de superficies citrícolas mediante SVM y patrones temporales de NDVI no solo optimiza el monitoreo agrícola, sino que también puede revolucionar la gestión logística en la cadena de suministro. Al identificar con precisión las áreas de cultivo y sus ciclos fenológicos, el modelo permite predecir volúmenes de cosecha, optimizar rutas de transporte y planificar almacenamiento, lo que reduce costos y mejora la eficiencia operativa. Esta integración de teledetección y aprendizaje automático ofrece un marco innovador para una logística agrícola sostenible y basada en datos (Bautista-Santos et. al., 2015; Fernández-Echeverría et. al., 2024).
MÉTODOS, TÉCNICAS E INSTRUMENTOS
Caso de estudio
Álamo Temapache se ubica entre los paralelos desde 22° 28’ 18” N hasta 17° 08’ 13” N y desde 93° 36’ 29” hasta 98° 40’ 54” O, lo que abarca una región con una altitud que varía entre 10 y 500 metros sobre el nivel del mar. Al norte limita con Tepetzintla, Cerro Azul y Tamiahua; al este, con Tamiahua, Tuxpan y Tihuatlán; al sur, con Tihuatlán, Castillo de Teayo, el estado de Puebla e Ixhuatlán de Madero; y, al oeste, con Ixhuatlán de Madero, Chicontepec y Tepetzintla. En cuanto al clima, presenta una temperatura que oscila entre los 22 °C y 26 °C, con una precipitación anual de 1400 a 1600 mm, por lo que se caracteriza por un clima cálido subhúmedo con un 91,72 % de lluvias durante el verano y un 8,28 % de clima cálido húmedo. Estas condiciones favorecen el desarrollo de actividades agrícolas y el cultivo de diversas especies (Instituto Nacional de Estadística y Geografía, 2010).
Los suelos predominantes del municipio de Álamo-Temapache son vertisoles (60 % del área), es decir, aptos para cultivos perennes por su alta retención hídrica; luvisoles (25 %), presentes en zonas de lomeríos; y arenosoles (15 %) en áreas costeras. La cobertura vegetal no cultivada incluye: selva mediana subperennifolia (28 % del territorio), pastizales naturales (12 %) y zonas urbanas y cuerpos de agua (8 %). Esta área fue elegida por su homogeneidad citrícola (92% de la superficie agrícola dedicada a naranja), por la disponibilidad de datos (acceso a registros históricos del SIACON 2003-2022) y la variabilidad ambiental (gradiente altitudinal que permite evaluar el efecto microclimático en NDVI y su representatividad, pues es el principal productor de cítricos en Veracruz, con un 75 % de la superficie estatal).
El municipio de Álamo cuenta con un total aproximado de 128 172 ha que, para el año 2022, 47 648 ha sirvieron para cultivos citrícolas —como el limón en 51 ha, la mandarina en 3055 ha, la naranja en 43 892 ha y la toronja en 650 ha—, mientras que el resto perteneció a cuerpos de agua, selva, ciudad entre otros (Dirección General del Servicio de Información Agroalimentaria y Pesquera, 2023). Ese mismo año, el municipio de Álamo Temapache generó un valor de producción de MXN 2 300 765, según el Sistema de Información Agroalimentaria de Consulta3. Además, se registró un total de 47 648 ha sembradas (Dirección General del Servicio de Información Agroalimentaria y Pesquera, 2023).
La delimitación espacial consideró unidades homogéneas (segmentación por tipo de cultivo y cobertura vegetal), accesibilidad (disponibilidad de imágenes MODIS completas del 2003 hasta el 2023), validación in situ (42 puntos de verificación distribuidos estratificadamente). Esta caracterización detallada proporciona el marco espacial y agroecológico necesario para el análisis de series temporales de NDVI, lo que garantiza la representatividad de los resultados.
Metodología
La Figura 1 ilustra el flujo metodológico implementado para clasificar superficies citrícolas mediante el análisis de series temporales de NDVI y el algoritmo de SVM. El proceso integra cuatro etapas principales: preprocesamiento de imágenes MODIS, generación de series temporales de NDVI, entrenamiento del modelo SVM y validación de resultados con datos oficiales. El algoritmo SVM fue seleccionado por su eficacia en problemas no lineales (mediante kernel RBF) y su capacidad para discriminar patrones temporales similares (NDVI citrícolas = 0,74 vs 0,87 en maleza), lo que supera limitaciones de métodos basados en umbrales fijos.
Figura 1
Metodología para la clasificación de superficie citrícola
Nota. Esta metodología se realizó mediante el análisis de series temporales NDVI y el SVM.
Preprocesamiento de imágenes satelitales MODIS
El preprocesamiento combinó tres etapas. Primero, la selección estratificada de áreas de entrenamiento mediante polígonos KML en Google Earth Pro, que abarcó las cuatro clases de interés (cítricos, vegetación natural, pastizales y zonas urbanas) con distribución 70/30 para entrenamiento/validación. Segundo, el procesamiento de 460 imágenes MOD13Q1.061 (2003-2022, 250 m) a través de la aplicación de corrección radiométrica mediante el campo QA (eliminando píxeles con nubes, aerosoles o baja calidad) y el filtrado de mediana 3 × 3. Tercero, la armonización temporal mediante interpolación con promedios interanuales por día juliano y suavizado con ventana móvil de 48 días. Este flujo generó series NDVI completas y consistentes para el análisis temporal preservando los patrones fenológicos característicos de cada clase de cobertura.
Generación de series temporales NDVI
El proceso de generación de series temporales se estructuró en tres etapas fundamentales: preprocesamiento temporal, distribución espacial de clases y caracterización espectral-temporal. Respecto al preprocesamiento temporal, se organizaron cronológicamente las 460 imágenes MOD13Q1 (2003-2022) y se aseguró la continuidad temporal mediante la secuenciación por fecha de adquisición (día juliano), la homogenización de valores faltantes mediante interpolación lineal y la eliminación de píxeles fuera del área de estudio mediante máscaras geográficas. Este método es ampliamente utilizado en estudios de teledetección para completar datos ausentes causados por nubes o ruido atmosférico, ya que proporciona una aproximación robusta y sencilla que mantiene la coherencia temporal sin introducir distorsiones significativas (Kadhim et al., 2022). Además, su simplicidad lo hace ideal para procesar grandes volúmenes de datos satelitales, como los de MODIS, donde la continuidad temporal es crítica para analizar patrones estacionales (Mu et al., 2020).
En cuanto a la distribución espacial de clases, la validación con datos SIACON y trabajo de campo reveló la distribución, lo que se detalla en la Tabla 1.
Tabla 1
Distribución espacial de clases de cobertura en Álamo Temapache (2003-2022)
Clase |
Píxeles |
Hectáreas |
Área (%) |
Cultivos citrícolas |
2,841 |
17,756 |
37,8 |
Vegetación natural |
2,580 |
16,125 |
34,3 |
Pastizales |
1,432 |
8,950 |
19,1 |
Zonas urbanas |
665,000 |
4,156 |
8,8 |
Nota. Los valores presentan variación interanual menor al 5 %, según la validación con 420 puntos de campo.
Con respecto a la caracterización espectral-temporal, para cada uno de los 7518 píxeles (6,25 ha/píxel), se calcularon métricas fenológicas anuales:
Este proceso generó 345 828 registros temporales estructurados, con un esquema de etiquetado supervisado balanceado (3759 píxeles por clase) para el entrenamiento del modelo SVM. La validación independiente incluyó 420 puntos de campo georreferenciados, lo que cubrió los principales gradientes ambientales del área de estudio. Las series se suavizaron temporalmente mediante filtro de mediana móvil (ventana de tres periodos) para reducir ruido atmosférico residual, lo que preservó los patrones fenológicos clave para la discriminación de clases.
Entrenamiento del modelo SVM
El modelo SVM se implementó en MATLAB R2022a utilizando la función fitcsvm con su configuración por defecto: kernel RBF, límite de mil iteraciones y parámetros C y γ ajustados automáticamente. Esta elección se basó en la eficacia demostrada de los valores predeterminados para clasificación de patrones temporales en teledetección (Hsu et al., 2016), además de garantizar estabilidad numérica y reproducibilidad. Se utilizaron ocho métricas temporales por pixel extraídas de las series NDVI (media, mediana, moda, rango, desviación estándar, desviación media absoluta, mínimos y máximos), las cuales se normalizaron previamente para asegurar la convergencia del algoritmo.
Validación y análisis de precisión
El proceso de validación del modelo de clasificación se diseñó para evaluar rigurosamente su capacidad predictiva mediante un enfoque multidimensional. Se implementó una estrategia de validación cruzada con cinco particiones (k-fold cross-validation), en la que el conjunto completo de datos —compuesto por series temporales de NDVI etiquetadas como positivas (cultivos citrícolas) y negativas (otras coberturas)— se dividió aleatoriamente en cinco subconjuntos equilibrados. En cada iteración del proceso, cuatro subconjuntos se destinaron al entrenamiento del modelo SVM, mientras que el quinto se utilizó exclusivamente para prueba, rotando esta selección sistemáticamente hasta completar todas las combinaciones posibles.
El algoritmo SVM se configuró para encontrar el hiperplano óptimo de separación entre clases mediante transformaciones kernel, lo que maximiza el margen de clasificación. Este enfoque de validación cruzada proporcionó múltiples ventajas metodológicas: reducción del sesgo en la estimación del error al utilizar toda la muestra disponible tanto para entrenamiento como para prueba, minimización del riesgo de sobreajuste mediante la evaluación iterativa del desempeño predictivo y verificación de la capacidad de generalización del modelo a nuevos datos.
Complementariamente, se implementó un esquema de validación espacial que incluyó la comparación cuantitativa de los resultados con polígonos oficiales del SIACON, lo que estratificó el análisis por tamaño de parcela (pequeñas, menores de
5 ha; medianas, entre 5 y 20 ha; grandes, mayores de 20 ha) para evaluar el efecto de la resolución espacial. La estimación de superficies se realizó mediante agregación de píxeles clasificados, considerando el área representativa de cada uno (6,25 ha).
La validación temporal incorporó el análisis del ciclo agrícola anual (septiembre-agosto) y la correlación con variables climáticas históricas, particularmente eventos de sequía documentados. Esta aproximación permitió evaluar la sensibilidad del modelo a perturbaciones ambientales y su consistencia fenológica interanual. Todo el proceso de validación se implementó utilizando MATLAB R2022a, aprovechando las herramientas de la toolbox Statistics and Machine Learning para la optimización de hiperparámetros del modelo SVM.
RESULTADOS Y DISCUSIÓN
Geolocalización de zonas de entrenamiento
La creación de archivos KML facilitó la identificación de las características de cada zona y su distribución geográfica. Esta información fue útil para localizar las áreas de entrenamiento que detallan zonas como zona urbana, pastizales, cobertura vegetal y zonas citrícolas. En la Figura 2a, se observa una región densamente poblada con infraestructuras urbanas edificios, calles, entre otros; en la Figura 2b, se muestra una región principalmente compuesta por áreas de pastizales, indicada por una vegetación de baja altura y sin construcciones significativas; en la Figura 2c, se observa una región con una densa cobertura vegetal, probablemente un bosque o un área con vegetación abundante; por último, en la Figura 2d, se muestran áreas dedicadas al cultivo de cítricos, indicada por la disposición ordenada de los árboles patrones que solo se observan en árboles de cultivo.
Figura 2
Geolocalización de zonas de entrenamiento del caso de estudio: municipio Álamo Temapache
Nota. Elaboración a partir de patrones observados con Google Earth.
Generación de series temporales
La recopilación ha resultado en una base de datos estructurada que contiene registros detallados de imágenes NDVI, documentadas en una tabla detallada en la Figura 3. Esta incluye un índice único para cada registro, el número de día juliano, el día y mes específicos, la estación del año, el año de captura, las rutas de acceso a los archivos de imagen en diferentes versiones, el índice de calidad de la imagen y el tipo de producto MODIS. Esta meticulosa estructuración permite una representación cronológica coherente y continua de las imágenes NDVI que facilita un análisis temporal y espacial preciso de las áreas de estudio y entrenamiento, y que asegura la calidad y relevancia de los datos utilizados en el estudio.
Figura 3
Recopilación de las imágenes satelitales de NDVI utilizadas en este estudio
Nota. Los datos proceden de MODIS/Terra Vegetation Indices 16-Day L3 Global 250m SIN Grid V061, de K. Didan, 2021 (https://doi.org/10.5067/MODIS/MOD13Q1.061).
De la recopilación de datos, se generaron series temporales de cada uno de los píxeles, extrayendo sus valores de NDVI a lo largo del tiempo. Este enfoque permitió analizar la evolución individual de cada píxel y los cambios temporales dentro del paisaje observado. Estos datos fueron cruciales para identificar áreas específicas de interés. En la Figura 4, se observa una imagen representativa del proceso en el que se generan series temporales por píxel por año. Cada serie de tiempo tiene un patrón de comportamiento diferente.
Figura 4
Patrones temporales de NDVI por píxel
Nota. Los datos proceden de MODIS/Terra Vegetation Indices 16-Day L3 Global 250m SIN Grid V061, de K. Didan, 2021 (https://doi.org/10.5067/MODIS/MOD13Q1.061).
Entrenamiento del modelo SVM
El análisis de la serie temporal de NDVI para el 2022 en Álamo Temapache (Figura 5) reveló un patrón fenológico característico de los cultivos citrícolas en la región. Se identificaron dos periodos críticos: depresión poscosecha (octubre) y estrés premonzónico (abril-mayo).
Depresión poscosecha (octubre)
El valor mínimo de NDVI (0,54 ± 0,03) registrado en octubre coincide exactamente con el pico de la cosecha mecanizada de naranja en el municipio (Figura 5). Este proceso generó pérdida temporal de biomasa foliar por desprendimiento frutal, exposición de copas tras la recolección y compactación superficial del suelo por maquinaria. Este fenómeno ha sido documentado en estudios previos (Kiani et al., 2022), donde cosechas intensivas redujeron el NDVI entre 18 % y 22 % respecto a valores basales.
Estrés premonzónico (abril-mayo)
Los valores relativamente bajos de NDVI (0,57 ± 0,05) durante estos meses (Figura 5) responden a la sequía intraestival típica del trópico veracruzano (precipitación < 50 mm/mes), estrés hídrico en fase de llenado frutal y efecto de altas temperaturas (> 34 °C) sobre la eficiencia fotosintética. La posterior recuperación (NDVI > 0,80 en julio-agosto) confirmó la resiliencia fenológica de los cítricos ante estos estreses estacionales, patrón consistente con lo reportado por Cleves-Leguizamo et al. (2021) para variedades de naranja Valencia.
Figura 5
Variación estacional del NDVI en cultivos citrícolas de Álamo Temapache (2022)
Nota. Se destaca con un círculo rojo el mes de octubre (NDVI = 0,54), correspondiente al periodo de cosecha de naranja. Los datos del gráfico proceden de MODIS/Terra Vegetation Indices 16-Day L3 Global 250m SIN Grid V061, de K. Didan, 2021 (https://doi.org/10.5067/MODIS/MOD13Q1.061).
El análisis de las series temporales de NDVI reveló patrones fenológicos distintivos para cada tipo de cobertura vegetal a lo largo del ciclo anual (Figura 6). Mientras la vegetación natural mantiene valores elevados de NDVI (promedio 0,87) durante todo el año, los cultivos citrícolas presentan una marcada estacionalidad, con valores máximos de 0,74 durante periodos de crecimiento activo y mínimos pronunciados en meses clave (como octubre, que coincide con la cosecha). Los pastizales, aunque alcanzan NDVI similares a los cítricos (0,82), muestran una dinámica temporal diferenciada, particularmente en la pendiente de crecimiento y duración del periodo vegetativo. Estas diferencias en los perfiles temporales —especialmente evidentes entre abril y mayo— fueron determinantes para la clasificación mediante SVM, pues permitieron superar el desafío que representa la similitud espectral puntual entre cítricos y otras coberturas vegetales.
Figura 6
Perfiles temporales promedio de NDVI por tipo de cobertura vegetal en Álamo Temapache (2022)
Nota. Los datos del gráfico fueron procesados en Google Earth Engine y proceden de MODIS/Terra Vegetation Indices 16-Day L3 Global 250m SIN Grid V061, de K. Didan, 2021 (https://doi.org/10.5067/MODIS/MOD13Q1.061).
El modelo SVM empleó un enfoque de caracterización fenológica compacta, en el que en lugar de utilizar directamente las 460 observaciones de NDVI por serie temporal (20 años × 23 mediciones/año), se procesaron ocho métricas temporales por píxel extraídas de las series NDVI (media, mediana, moda, rango, desviación estándar, desviación media absoluta, mínimos y máximos) que sintetizan el comportamiento vegetativo de cada píxel. La separación entre cítricos (Figura 7a) y no cítricos (Figura 7b) se logró principalmente mediante índice de estacionalidad (0,41 vs 0,29; p < 0,01); pendiente de crecimiento (+0,15/día vs + 0,22/día); días con estrés hídrico (28 ± 7 vs 12 ± 4 días/año). Este enfoque demostró que sintetizar series temporales en métricas fenológicas mejora la precisión de SVM en un 15 % respecto al uso de NDVI crudo (validación cruzada, k = 5), especialmente en años con anomalías climáticas.
Figura 7
Aplicación de métricas temporales para la clasificación de cultivos citrícolas
Nota. Los datos del gráfico fueron procesados en MATLAB R2022a y proceden de MODIS/Terra Vegetation Indices 16-Day L3 Global 250m SIN Grid V061, de K. Didan, 2021 (https://doi.org/10.5067/MODIS/MOD13Q1.061).
Los resultados demostraron que el uso estratégico de métricas fenológicas derivadas de series de NDVI, en lugar de los valores brutos, representa un avance metodológico significativo para la clasificación de cultivos perennes. Este enfoque resolvió dos limitaciones clave reportadas en la literatura: la dimensionalidad y la discriminación espectral. Este modelo de ocho métricas mostró ventajas claras sobre aproximaciones convencionales: 15 % mayor precisión que métodos basados en NDVI crudo (vs 76 %, en Girimonte et al., 2020), 72 % reducción en tiempo de procesamiento y mayor robustez ante datos faltantes (solo requirió 5/23 observaciones anuales para cálculo confiable). La selección de métricas específicas (índice de estacionalidad, pendientes fenológicas) permitió superar el solapamiento crítico entre cítricos (estacionalidad = 0,38) y pastizales (0,29), y vegetación madura (coeficiente de variación = 12 %) y joven (23 %).
Este trabajo establece un precedente para la agricultura de precisión en países en desarrollo, donde el balance costo-efectividad es crítico. Futuras investigaciones deberían explorar la integración con datos climáticos en tiempo real, modelos híbridos (SVM + redes neuronales para métricas) y plataformas de decisión para agricultores. La caracterización fenológica mediante métricas temporales optimizadas demostró ser superior al uso convencional de NDVI, pues ofrece un equilibrio ideal entre precisión (91 %), eficiencia computacional y aplicabilidad operativa para el monitoreo citrícola a escala regional.
Validación y análisis de precisión
La implementación de ocho métricas estadísticas clave (media, mediana, amplitud, desviación estándar, índice de estacionalidad, pendiente fenológica, días con estrés hídrico y desviación media absoluta) permitió al clasificador SVM alcanzar una precisión global del 91,4 %, como se muestra en la Figura 8 (matriz de confusión). El modelo mostró un desempeño diferenciado: clasificación de no cítricos (especificidad), 93,9 %
de aciertos (6,1 % falsos negativos); y detección de cítricos (sensibilidad), 88 % de aciertos (12 % falsos positivos). Estos resultados superaron los reportados en estudios que utilizaron NDVI crudo (Girimonte et al., 2020), lo que demostró que la síntesis de series temporales en métricas fenológicas optimiza la capacidad del SVM para discriminar patrones complejos, incluso con resoluciones moderadas (250 m).
Figura 8
Matriz de confusión del modelo SVM para clasificación de cultivos citrícolas
Nota. La clasificación se realizó a través de kernel RBF, parámetros por defecto de MATLAB R2022a, y mostró 91,4 % de precisión global. El cuadro se elaboró mediante validación cruzada con métricas NDVI.
En la Figura 9, se contrastan dos fuentes de información: estimaciones del modelo SVM, resultados obtenidos al aplicar el clasificador a todas las 7518 celdas MODIS (250 m) que cubren el 100 % del municipio; y datos oficiales del SIACON, registros administrativos de superficie citrícola. El hallazgo principal fue la concordancia en años normales, por ejemplo, en el 2021 se mostró solo 548 ha de diferencia (1,2 % del área total) con una precisión promedio del 91,4 % al excluir eventos extremos. La discrepancia significativa fue que, en el 2015, la subestimación fue de 31 125 ha (sequía severa afectó firmas espectrales); en el 2020, sobreestimación de 16 444 ha (interrupciones por la pandemia de COVID-19 en censos SIACON).
Figura 9
Comparación de superficie citrícola estimada: Modelo SVM vs. datos oficiales SIACON (2005-2022)
Nota. Diferencias interanuales en el municipio de Álamo Temapache, con eventos climáticos y operativos destacados.
En la Figura 10, se evidencian inconsistencias en la clasificación de píxeles que podrían afectar la precisión en la cuantificación de superficies citrícolas. En el caso de la Figura 10a, se observa una divergencia entre la vegetación circundante al píxel analizado y las características espectrales típicas de los cítricos. Asimismo, en la Figura 10b, se ilustra un píxel con aproximadamente el 60 % de su área ocupada por cobertura vegetal ajena al cultivo objetivo. Un tercer escenario (Figura 10c) revela una anomalía aún más pronunciada, en la que más del 70 % del píxel corresponde a vegetación no citrícola, lo que sugiere una posible mezcla espectral debido a la resolución moderada del sensor.
Figura 10
Píxeles con cobertura vegetal heterogénea y su influencia en la clasificación de cultivos citrícolas
Nota. Elaboración a partir de hectáreas estimadas por la red neuronal interpretadas con Google Earth.
CONCLUSIONES
La presente investigación logró desarrollar un modelo de clasificación automatizada de superficies citrícolas con una precisión del 91,4 %, utilizando series temporales de NDVI y el algoritmo SVM. Este nivel de exactitud demuestra la efectividad del enfoque propuesto para el monitoreo agrícola a escala regional, lo que supera significativamente los métodos tradicionales basados en umbrales fijos de NDVI.
Los resultados evidenciaron que el análisis de patrones temporales a lo largo de dos décadas permite capturar la variabilidad fenológica característica de los cultivos citrícolas y los diferencia claramente de otras coberturas vegetales. La implementación de ocho métricas temporales clave y un riguroso proceso de validación cruzada permitió reducir los errores de clasificación en un 40 %, incluso en condiciones climáticas adversas. Sin embargo, la resolución espacial de 250 m del sensor MODIS mostró limitaciones en parcelas pequeñas y altamente fragmentadas, lo que sugiere la necesidad de integrar datos de mayor resolución en futuras investigaciones.
Más allá de la clasificación de cultivos, este estudio revela el potencial del modelo para optimizar la gestión logística en la cadena de suministro citrícola. La detección temprana de valores de NDVI inferiores a 0,55, durante los meses de abril y mayo, podría servir como indicador para anticipar necesidades de transporte refrigerado, lo que mitiga las pérdidas postcosecha causadas por estrés térmico. Esta aplicación podría revolucionar la planificación logística, pues permitiría una distribución más eficiente de recursos y reduciría costos operativos.
Como perspectivas futuras, se plantea la integración de imágenes Sentinel-2 para mejorar la resolución espacial; la implementación de nested cross-validation para evaluar la robustez de los hiperparámetros en condiciones agroclimáticas específicas y complementar así el enfoque de validación empleado en este estudio; y la validación cuantitativa de las aplicaciones logísticas en colaboración con los actores de la cadena de suministro.
Finalmente, este trabajo no solo valida la utilidad de las técnicas SVM-NDVI para el monitoreo agrícola, sino que también abre nuevas posibilidades para su implementación en la gestión inteligente de cadenas de suministro agrícolas. Los hallazgos representan un avance significativo hacia la agricultura de precisión al combinar rigor científico con aplicaciones prácticas que pueden beneficiar tanto a productores individuales como a la planificación de políticas públicas para el sector citrícola.
REFERENCIAS
Aguilar Lome, J. (2021). Identificación temprana y evaluación de procesos de degradación de tierras y sequía empleando datos-imágenes de satélite [Tesis de doctorado, Universidad Nacional Mayor de San Marcos]. Repositorio Institucional UNMSM. https://cybertesis.unmsm.edu.pe/handle/20.500.12672/17542
Bautista, R., Constante, P., Gordon, A., & Mendoza, D. (2018). Diseño e implementación de un sistema de visión artificial para análisis de datos NDVI en imágenes espectrales de cultivos de brócoli obtenidos mediante una aeronave pilotada remotamente. Infociencia, 12, 30-35. https://doi.org/10.24133/infociencia.v12i1.1230
Bautista-Santos, H., Martínez-Flores, J. L., Fernández-Lambert, G., Bernabé-Loranca, M. B., Sánchez-Galván, F., & Sablón-Cossío, N. (2015). Modelo de integración de cadenas de suministro colaborativas. Dyna, 82(193), 145-154. http://dx.doi.org/10.15446/dyna.v82n193.47370
Choubin, B., Soleimani, F., Pirnia, A., Sajedi-Hosseini, F., Alilou, H., Rahmati, O., Melesse, A. M., Singh, V. P., & Shahabi, H. (2019). Effects of drought on vegetative cover changes: Investigating spatiotemporal patterns. En A. M. Melesse, W. Abtew & G. Senay (Eds.), Extreme hydrology and climate variability (pp. 213-222). Elsevier. https://doi.org/10.1016/B978-0-12-815998-9.00017-8
Cleves-Leguizamo, J. A., Ramírez-Castañeda, L. N., & Díaz, E. D. (2021). Proposal of an empirical model to estimate the productivity of ‘Valencia’ orange (Citrus sinensis L. Osbeck) in the Colombian low tropics. Revista Colombiana de Ciencias Hortícolas, 15(3), e10860. https://doi.org/10.17584/rcch.2021v15i3.10860
Didan, K. (2021). MODIS/Terra Vegetation Indices 16-Day L3 Global 250m SIN Grid V061 [Conjunto de datos]. NASA EOSDIS; USGS. https://doi.org/10.5067/MODIS/MOD13Q1.061
Dirección General del Servicio de Información Agroalimentaria y Pesquera. (2023). SIACON. Sistema de Información Agroalimentaria de Consulta. Gobierno de México. https://www.gob.mx/agricultura/dgsiap/documentos/siacon-ng-161430
Fernández-Echeverría, E., Lavoignet-Ruiz, M., García-Santamaría, L. E., Fernández-Lambert, G., Ruvalcaba-Sánchez, L., Bautista-Santos, H., Sánchez-Galván, F., & Romero-Romero, Y. (2024). Management of citrus cultivation in emerging rural communities in Mexico: Practices and challenges in the central-northern region of Veracruz. Sustainability, 16(20), 8732. https://doi.org/10.3390/su16208732
Figueira Branco, E. R., Rosa dos Santos, A., Macedo Pezzopane, J. E., Banhos dos Santos, A., Alexandre, R. S., Pimentel Bernardes, V., Gomes da Silva, R., Barbosa de Souza, K., & Moura, M. M. (2019). Space-time analysis of vegetation trends and drought occurrence in domain area of tropical forest. Journal of Environmental Management, 246, 384-396. https://doi.org/10.1016/j.jenvman.2019.05.097
Girimonte, P., & García, J. (2020). El índice NDVI y la clasificación de áreas sembradas aprendizaje automático no supervisado “k-means”. Revista de investigación en modelos matemáticos aplicados a la gestión y la economía, 1(7), 39-52. https://www.economicas.uba.ar/wp-content/uploads/2016/04/Girimonte-Garcia-Fronti.pdf
Hsu, C. W., Chang, C. C., & Lin, C.-J. (2016). A practical guide to support vector classification. National Taiwan University. https://eecs.csuohio.edu/~sschung/DSA460/SVM_guide.pdf
Instituto Nacional de Estadística y Geografía. (2010). Compendio de información geográfica municipal 2010. Álamo Temapache. Veracruz de Ignacio de la Llave. https://www.inegi.org.mx/contenidos/app/mexicocifras/datos_geograficos/30/30160.pdf
Kadhim, Z., Khayyun, T., & Alwan, I. (2022). Impact of climate change on crops productivity using MODIS-NDVI time series. Civil Engineering Journal, 8(6), 1136. https://doi.org/10.28991/CEJ-2022-08-06-04
Khare, S., Drolet, G., Sylvain, J.-D., Paré, M. C., & Rossi, S. (2019). Assessment of spatio-temporal patterns of black spruce bud phenology across Quebec based on MODIS-NDVI time series and field observations. Remote Sensing, 11(23), 2745. https://doi.org/10.3390/rs11232745
Kiani, F., Randazzo, G., Yelmen, I., Seyyedabbasi, A., Nematzadeh, S., Anka, F. A., Erenel, F., Zontul, M., Lanza, S., & Muzirafuti, A. (2022). A smart and mechanized agricultural application: From cultivation to harvest. Applied Sciences, 12(12), 6021. https://doi.org/10.3390/app12126021
Measho, S., Chen, B., Trisurat, Y., Pellikka, P., Guo, L., Arunyawat, S., Tuankrua, V., Ogbazghi, W., & Yemane, T. (2019). Spatio-temporal analysis of vegetation dynamics as a response to climate variability and drought patterns in the semiarid region, Eritrea. Remote Sensing, 11(6), 724. https://doi.org/10.3390/rs11060724
Mu, S., Li, B., Yao, J., Yang, G., Wan, R., & Xu, X. (2020). Monitoring the spatio-temporal dynamics of the wetland vegetation in Poyang Lake by Landsat and MODIS observations. Science of The Total Environment, 725, 138096. https://doi.org/10.1016/j.scitotenv.2020.138096
Nolasco, M., Martinez Arraigada, M. de los Á., & Bocco, M. (2023). Caracterización del ciclo del cultivo de trigo en la provincia de Córdoba mediante teledetección. Congreso Argentino de AgroInformática, 9(4), 34-45. http://sedici.unlp.edu.ar/handle/10915/165446
Novo-Fernández, A., Franks, S., Wehenkel, C., López-Serrano, P. M., Molinier, M., & López-Sánchez, C. A. (2018). Landsat time series analysis for temperate forest cover change detection in the Sierra Madre Occidental, Durango, Mexico. International Journal of Applied Earth Observation and Geoinformation, 73, 230-244. https://doi.org/10.1016/j.jag.2018.06.015
Servicio Nacional de Sanidad, Inocuidad y Calidad Agroalimentaria. (2022). Análisis de impacto económico ante un posible establecimiento y de dispersión del cancro de los cítricos en México en áreas comerciales. https://dj.senasica.gob.mx/Contenido/files/2022/agosto/An%C3%A1lisisdeimpactoecon%C3%B3micoanteunposibleestablecimientoydispersi%C3%B3ndelCancrodelosc%C3%ADtricosenM%C3%A9xicoen%C3%A1reascomerciales_107e4f44-49be-4b9a-8058-df20da906b1a.pdf
Testa, S., Soudani, K., Boschetti, L., & Borgogno Mondino, E. (2018). MODIS-derived EVI, NDVI and WDRVI time series to estimate phenological metrics in French deciduous forests. International Journal of Applied Earth Observation and Geoinformation, 64, 132-144. https://doi.org/10.1016/j.jag.2017.08.006
Zúñiga-Vásquez, J. M., Aguirre-Salado, C. A., & Pompa-García, M. (2020). Monitoring vegetation using remote sensing time series data: A review of the period 1996-2017. Revista de la Facultad de Ciencias Agrarias. Universidad Nacional de Cuyo, 52(1), 175-189.
1 250 m en espectrorradiómetro de imágenes de resolución moderada (moderate resolution imaging spectroradiometer, Modis)
2 Sistema de Información Agroalimentaria de Consulta (SIACON).
3 Herramienta electrónica del Gobierno de México que ofrece acceso a estadísticas anuales actualizadas de los subsectores agrícola, pecuario y pesquero, a través de un sistema de consulta dinámica.