La información de alta resolución generada por los drones permitió generar mapas de dosificación variable para emplear en un vehículo autónomo terrestre (AGV)
Evaluación de dos algoritmos basados en 'Machine Learning' para detección de malas hierbas en viñedo mediante imágenes UAV
Rubén Vacas1*, Daniel Martinez-Porro1, Soraya Arín1, Sergio Vélez2, José Antonio Rubio1, Enrique Barajas1
1Instituto Tecnológico Agrario de Castilla y León (ITACyL), 47071 Valladolid, España
2Group Agrivoltaics, Fraunhofer Institute for Solar Energy Systems. 79110, Freiburg, Alemania
*e-mail: ita-vacizqru@itacyl.es
02/06/2026La viticultura de precisión tiene como objetivo la gestión más eficiente de los viñedos mediante decisiones informadas. Una herramienta clave son los mapas de dosificación variable de insumos (VRA), generados a partir de datos geoespaciales recopilados por sensores. Estos mapas identifican variaciones relacionadas con vigor, enfermedades, fertilización y estado hídrico. Los vehículos aéreos no tripulados (UAV) son capaces de obtener imágenes de muy alta resolución espacial, proporcionando información precisa de la distribución de las malas hierbas y del dosel del viñedo.
El objetivo de este trabajo fue evaluar la precisión de dos modelos de clasificación supervisada basados en 'Machine Learning': Support Vector Machine (SVM) y Redes Neuronales (ANN), para detectar áreas con malas hierbas, sombras, suelo y área foliar en un viñedo cultivado en vaso. Para ello se emplearon imágenes multiespectrales de alta resolución obtenidas mediante un UAV, en las que se establecieron áreas de entrenamiento y se calcularon estadísticas de validación de los algoritmos de clasificación. Además, se analizó la separabilidad entre clases con los diferentes espacios de entidades.
Introducción
Uno de los objetivos de la viticultura de precisión es disminuir el coste económico y medioambiental mediante el manejo diferenciado del viñedo. Para mapear con precisión la variabilidad intra-parcelaria, son valiosas las imágenes de alta resolución que proporcionan los vehículos aéreos no tripulados (UAVs). Uno de los procesos geoinformáticos clave en la teledetección de cultivos con este tipo de imágenes es la obtención de pixeles puros de vegetación, que no presenten contaminación de información del suelo, sombras o malas hierbas que alteren los datos reales del viñedo.
En este sentido, se utilizan varias técnicas para la clasificación de pixeles en el terreno, que son aplicadas para la identificación de las clases de interés mencionadas. Existen técnicas basadas en umbrales de índices de vegetación o en la altura del cultivo, utilizadas habitualmente para discriminar entre el suelo y la vegetación. Otras técnicas que utilizan algoritmos de clasificación como random forest o k means han sido empleadas para identificar las sombras proyectadas para estimar el índice de área foliar (LAI) en viñedos (Vélez et al., 2021).
También los métodos de clasificación basados en objetos (OBIA) capaces de incorporar en los algoritmos, además de la información espectral, información contextual como la posición o el tamaño, han sido utilizados para la detección de grama en viña (De Castro et al., 2017, Torres-Sánchez et al., 2021). Incluso algoritmos de aprendizaje profundo como YOLO han sido aplicados para la identificación de vides senescentes (Gavrilovic et al., 2024).
El objetivo de este trabajo fue evaluar la exactitud de dos modelos de aprendizaje automático Máquinas de Soporte Vectorial (SVM) y Redes Neuronales Artificiales (ANN) con el propósito de identificar zonas de malas hierbas, sombras, suelo y área foliar en un viñedo cultivado en vaso. Este proyecto se enmarcó en un entorno experimental con conectividad 5G desplegado por la empresa NOKIA SPAIN, para la validación de tecnologías de comunicación en usos agronómicos.
Material y Métodos
Área de estudio
El viñedo se sitúa en la localidad de Matanza de Soria al norte del término municipal de San Esteban de Gormaz en la comarca agraria del Burgo de Osma en la provincia de Soria, en el extremo oriental de la DO Ribera de Duero. El clima es mediterráneo continental. La temperatura media anual se halla en torno a los 11,5 °C con precipitaciones medias anuales de 470 mm.
El ensayo se realiza en una parcela de secano de 0,16 ha (coordenadas ETRS89 / UTM zona 30N: 41,641, -3,2075) a una altura de 940 mmsl. El material empleado fueron cepas centenarias de Vitis vinifera L, cv. Tempranillo, aunque también se pueden encontrar Albillo Mayor, con un marco de plantación de 1m x 1m. El sistema de conducción es en vaso.
Obtención de imágenes
Se realizó un vuelo en DOY (Day Of the Year) 187 de 2023 con un vehículo aéreo no tripulado (UAV), DJI Matrice 300 con posicionamiento kinemático en tiempo real (RTK), equipado con un sensor multiespectral (Altum, Micasense, Inc., Seattle, WA, USA) que permite capturar imágenes georreferenciadas con precisión centimétrica de 2064 x 1544 (3,2 MP) de resolución e imágenes térmicas de 160 x 120, las características de las bandas espectrales se detallan en la tabla 1.
Las imágenes se tomaron a 40 m de altura sobre el terreno, a las 9:30 hora solar, con un 80% y 75% de solapamiento transversal y longitudinal respectivamente. Para la calibración radiométrica de las imágenes se tomaron imágenes nadir del panel de reflectancia al inicio y posterior al vuelo.
Procesamiento y análisis
Las imágenes adquiridas fueron procesadas mediante el software Agisoft Metashape (v1.7.6 Agisoft LLC, San Petersbugo, Rusia). Obteniendo una ortofoto de 1,73 cm/píxel de GSD con 6 bandas espectrales. El software QGIS (versión 3.16.15), se empleó para el cálculo de los índices de vegetación (IVs) que figuran en la tabla 2, utilizados habitualmente para la obtención de pixeles puros de vegetación mediante la segmentación de suelo-vegetación como el NDVI (Normalized Difference Vegetation Index), HUE (Overall Hue Index), ExG (Excess Green Index). El análisis de las imágenes se efectuó mediante el programa ENVI (versión 5.3). El flujo de trabajo que se describe a continuación se representa en la figura 1.
Definición de clases y áreas de entrenamiento
Para la clasificación supervisada de imágenes multiespectrales se utilizaron áreas de entrenamiento para cada clase de información. Identificando en la imagen áreas de cobertura representativas de cada clase y cuyas características espectrales servirán para entrenar los algoritmos de clasificación. Está información se basó en interpretación visual de la imagen. Las categorías establecidas fueron: i) VID: pixeles ocupados por Vitis vinífera; ii) Suelo (GR): Superficie en la que no se encuentra ningún tipo de vegetación, construcción o agua; iii) Malas Hierbas (MH): vegetación adventicia, de porte herbáceo que se desarrolla libremente entre las cepas; iv) Sombras (SW): áreas con reducción significativa de la luz visible debido a la obstrucción causada por objetos verticales como árboles, cepas, edificios o relieves topográficos. Con esta información se generó una capa vectorial de tipo polígono con un total de 318 áreas de entrenamiento, convertida a Region Of Interest (ROI) en ENVI.
Análisis de separabilidad de bandas
Para determinar qué información espectral (bandas, IVs) es más adecuada para diferenciar las clases de interés, se determinó el grado de separabilidad de las clases empleando cada combinación de bandas mediante la Distancia de Jeffries-Matusita, en la que la máxima separabilidad entre clases equivale a un valor de 2.
Algoritmos de Clasificación
La comparación se realizó entre dos algoritmos de clasificación supervisada no paramétricos: i) Neural Net (ANN) o Redes Neuronales Artificiales; este algoritmo está diseñado para emular la función de reconocimiento de patrones humanos a través del procesamiento paralelo de múltiples entradas, es decir, las ANN tienen la capacidad de identificar datos en busca de patrones y se pueden usar para construir modelos no lineales (Chang y Lin, 2011).
Los parámetros utilizados fueron los siguientes: 'Training Threshold Contribution' 0,9, 'Training Rate' 0,2 'TM Training Momentum' 0,9 RMS 'Root Means Square' 0, 'Number of Iteration' 0 ii) Support Vector Machine (SVM); este algoritmo a partir del producto escalar de los vectores multidimensionales de las muestras construye un hiperplano o conjunto de hiperplanos y un espacio de dimensionalidad muy alta que separa los grupos. Para la modelización, se requiere una fase inicial de entrenamiento y aprendizaje. Una vez conformada la modelización el sistema está listo para recibir nuevas entradas y buscar la correspondencia entre el modelo y las entradas para clasificarlas (Richard, 1999). La clasificación de la imagen se realizó utilizando los parámetros predeterminados de base radial Kernel.
Validación
El tamaño de la muestra para los puntos de validación se basó en Congalton (1991) y consistió en un total de 250 puntos, MH (70 pts), SW (55 pts), GR (55 pts), VID (70 pts). La generación de puntos de validación se realizó mediante muestreo aleatorio. La caracterización de la cobertura se efectuó mediante fotointerpretación y comprobación en campo mediante un GNSS RTK JAVAD. A partir de estos datos se generó una matriz de confusión para calcular los estadísticos de validación que proporcionan una descripción de la precisión del mapa temático y para la comparación de precisiones, de la cual se obtiene la fiabilidad global o número de casos asignados correctamente frente al número de casos de referencia desde los puntos de vista del usuario y del productor (Foody, 2001). A partir de esta matriz se calcularon los intervalos de confianza al 95% utilizando el método de Wald para muestras mayores a 100 datos (Sauro y Lewis, 2005).
El porcentaje y superficie de cada clase se obtuvo vectorizando el ráster obtenido de la clasificación y mediante la herramienta estadísticas de zona de QGIS.
Resultados y Discusión
En cuanto a los resultados del análisis de separabilidad de clases, la combinación de bandas más apropiada para efectuar la clasificación resultó ser el espacio de entidades compuesto por las bandas R/G/B/NIR/RE/LWIR y el índice NDVI. Con el valor más alto (1,810) para la discriminación entre las clases de interés MH y VID. Los espacios de entidades analizados se describen en la tabla 3.
El resultado de la clasificación mediante ANN (Tabla 4) obtuvo una exactitud global del 94,40% con una precisión del productor para la clase MH del 92,86% y un error de comisión del 8,45%. Los errores de comisión cometidos para la clase GR y VID alcanzaron el 5,36% y 4,35% respectivamente. Mientras que para el algoritmo de clasificación SVM (Tabla 5), la exactitud global de la clasificación fue del 91,60% con una exactitud del productor y errores de comisión del 87,14% y 12,86% respectivamente para la clase MH.
Conclusiones
Los resultados mostraron una exactitud global superior al 90% en la clasificación para ambos algoritmos. Sin embargo, mediante ANN los casos correctamente identificados en la referencia fueron superiores en la clase Malas Hierbas. La separabilidad de bandas mejoró con la inclusión de la banda térmica. Se obtuvo un porcentaje de cobertura del suelo del 59% para la clase suelo desnudo, un 34% de malas hierbas y un 3% de superficie foliar cenital del viñedo (Tabla 6).
La alta resolución de los datos obtenidos con el UAV permitió una segmentación detallada de los componentes de la parcela, lo que ayudó a crear mapas de dosificación variable para su uso en un vehículo autónomo terrestre (AGV).
Agradecimientos
Este trabajo ha sido posible gracias a los proyectos con financiación CDTI 5G AGROGREEN y 5GNACARen colaboración con las empresas NOKIA y APTICA. Los autores desean expresar su agradecimiento a la bodega La Loba por su implicación en este trabajo.
Chang, C.C. and Lin, C.J. 2011. LIBSVM: A library for support vector machines. ACM Transactions on Intelligent Systems and Technology. Vol 2, 3, Article 27 pp 1-27.
De Castro, A., Peña-Barragán, J. M., Torres-Sánchez, J., Jiménez-Brenes, F. Valencia, F. and López-Granados, F. 2017. Detección de grama (Cynodon dactylon) en viña mediante imágenes adquieridas por un vehículo aéreo no tripulado (UAV). II Jornadas en Viticultura de la SECH. 243-248 Acta 76
Foody G, M. 2001. Status of land cover classification accuracy assessment. Remote Sensing of Environment, 80:185-201.
Gavrilović, M., Jovanović, D., Božović, P., Benka, P. and Govedarica, M. Vineyard Zoning and Vine Detection Using Machine Learning in Unmanned Aerial Vehicle Imagery. Remote Sens. 2024, 16:584.
Richards, J.A. 1999. Remote Sensing Digital Image Analysis: An Introduction, Springer-Verlag, Berlin, Germany, 240 p.
Sauro, J. and Lewis, J. 2005. Estimating Completion Rates from Small Samples using Binomial Confidence Intervals: Comparisons and Recommendations. 49(24), 2100-2103 Proceedings of the Human Factors and Ergonomics Society Annual Meeting, Orlando, 49(24), 2100:2103.
Torres-Sánchez, J., Mesas-Carrascosa, F.J., Jiménez-Brenes, F.M., de Castro, A.I. and López-Granados, F. 2021. Early Detection of Broad-Leaved and Grass Weeds in Wide Row Crops Using Artificial Neural Networks and UAV Imagery. Agronomy, 11:749.
Vélez, S., Poblete-Echeverría, C., Rubio, J. A., Vacas, R., and Barajas, E. 2021. Estimation of Leaf Area Index in vineyards by analysing projected shadows using UAV imagery. OENO One, 55(4):159:180.
























