Detección automática de podredumbres en cítricos mediante análisis de imágenes backscattering
La detección temprana y automática de infecciones por hongos en poscosecha de cítricos es un problema de especial interés comercial todavía sin resolver, ya que provocan graves pérdidas económicas para la industria. Actualmente, esta detección se realiza en los almacenes de confección por personal entrenado iluminando la fruta con peligrosa luz ultravioleta. El Instituto Valenciano de Investigaciones Agrarias, a través del Centro de Agroingeniería, lleva tiempo estudiando métodos alternativos de detección temprana de la fruta afectada por podredumbre que eviten el riesgo de una manipulación bajo este peligroso tipo de luz. En este trabajo se ha estudiado el potencial de la técnica de imagen basada en backscattering con la finalidad de detectar podredumbres incipientes en frutos cítricos tras inocularlos con el hongo Penicillium digitatum. Las imágenes backscattering se tomaron de naranjas cv. 'Navelate' usando cinco diodos láser que emiten en longitudes de onda distintas en el visible y el infrarrojo cercano. Estas imágenes se utilizaron para estudiar el reflejo de estos láseres en fruta sana y en fruta dañada mediante algoritmos de análisis de imágenes y clasificar la fruta en dos clases distintas (sana y podrida) mediante un clasificador de tipo supervisado basado en análisis discriminante lineal (LDA), llegando a alcanzar un éxito del 96,1%.
Las podredumbres causadas por hongos del género Penicillium se encuentran entre los principales problemas que afectan la poscosecha y comercialización de cítricos (Palou et al., 2011). La detección temprana y automática de infecciones por hongos en poscosecha de cítricos es un problema de especial interés comercial todavía sin resolver, ya que un reducido número de frutas podridas puede contaminar una partida completa durante el almacenamiento o transporte. Actualmente, esta detección se realiza por personal entrenado iluminando la fruta con luz ultravioleta. Sin embargo, este proceso tiene un alto riesgo de presentar errores humanos y, además, la exposición de los operarios a este tipo de iluminación resulta dañina.
Con el fin de evitar los inconvenientes de la inspección visual, los sistemas automáticos de visión por computador se presentan como una posible solución para detectar fruta podrida automáticamente (Cubero et al., 2011). Sin embargo, algunos daños, como las podredumbres en estadios tempranos de infección, son especialmente difíciles de detectar utilizando sistemas convencionales de visión por computador, como las cámaras RGB, ya que estos defectos son difícilmente visibles a simple vista por el ojo humano. Por lo tanto, se han incorporado otras tecnologías de visión por computador para la detección automática de podredumbres en cítricos, como el uso de fluorescencia inducida por luz ultravioleta (Kurita et al., 2009, Blanc et al., 2010) o la introducción de sensores hiperespectrales (Lorente et al., 2012).
Recientemente, los sistemas de visión basados en backscattering se han estudiado como una técnica alternativa de visión por computador para evaluar la calidad de la fruta. En concreto, muchos estudios se han centrado en usar está técnica en manzanas y otras frutas (Lu, 2004; Qing, 2007), aunque no se ha usado todavía para detectar podredumbres en cítricos. Esta técnica emergente está basada en la retrodispersión de la luz (backscattering). Este fenómeno es un tipo de reflexión de la luz y sucede cuando la luz, en vez de reflejarse especular o difusamente, interacciona con los componentes internos de la fruta y luego vuelve de nuevo al exterior de la superficie, por lo cual, esta luz contiene información relacionada con la morfología y estructuras del tejido (Birth, 1976).
Por lo tanto, puesto que el proceso de podredumbre implica cambios estructurales en el tejido de la fruta, la técnica de imagen basada en backscattering podría ser una prometedora herramienta para detectar podredumbres en cítricos. El principal objetivo de este trabajo fue estudiar el potencial de los sistemas de imagen basados en backscattering para la detección automática de podredumbres incipientes causadas por el hongo Penicillium digitatum en cítricos. Para ello, se tomaron imágenes backscattering de naranjas usando diodos láser que emiten en cinco longitudes de onda distintas en el visible y en el infrarrojo y se utilizó una función de distribución producto cruzado de Gaussiana y Lorentziana (GL) de cinco parámetros independientes para caracterizar los resultantes perfiles backscattering. Además, con el objetivo de clasificar la fruta en naranjas sanas y podridas, se construyeron clasificadores basados en análisis discriminante lineal (LDA) usando los parámetros GL para cada longitud de onda como vector de características. El último objetivo fue comparar las longitudes de onda de láser en términos de su contribución a la detección de podredumbres, con la finalidad de encontrar la combinación de longitudes de onda más adecuada para detectar fruta podrida.
Material y métodos
Material vegetal
Para los experimentos se emplearon naranjas cv. ‘Navelate’ (Citrus sinensis L. Osbeck) provenientes del la colección de campo del Banco de Germoplasma de Cítricos del IVIA (Navarro et al., 2002). Se usaron un total de 100 frutos: 50 inoculados con esporas del hongo P. digitatum (podredumbre verde) y 50 inoculados con agua para control. La inoculación fúngica se realizó artificialmente en frutos sanos depositando 20 µl de una suspensión de esporas con una a la concentración de 106 esporas/ml en una herida superficial de la piel. Esta es una concentración de inóculo utilizada habitualmente en ensayos para producir podredumbre verde (Palou et al., 2001). Los frutos se almacenaron durante cuatro días a 20 °C y una humedad relativa del 65%. Tras este periodo, todas las frutas inoculadas con el hongo presentaban daños superficiales con un diámetro igual o superior a 30 mm. La Fig. 1 muestra imágenes RGB de una fruta sana y de una fruta con podredumbre incipiente.
Figura 1: Imágenes RGB de una naranja sana (izquierda) y de una naranja con podredumbre incipiente producida por el hongo P. digitatum (derecha).
Sistema de adquisición de imágenes
El sistema de adquisición de imágenes se componía de una cámara CCD de alta eficiencia (JAI CV-A50 IR), cinco diodos láser que emiten en longitudes de onda distintas (532, 660, 785, 830 and 1060 nm) usados alternativamente como fuentes de luz y un ordenador para controlar la cámara. La Fig. 2a muestra un ejemplo de imagen backscattering. El sistema de imagen se situó en una habitación oscura para evitar la influencia de la luz ambiental y se configuró para capturar imágenes con un tamaño de 720 576 píxeles y una resolución de 0,0730 mm/píxel. El ángulo de incidencia del haz de luz se fijó a 7˚ con respecto al eje vertical, lo que permitió asumir que el haz de luz era casi perpendicular a la superficie de la fruta con el fin de obtener imágenes simétricas respecto al punto de incidencia de la luz. En la Fig. 2b se muestra el esquema del sistema de adquisición de imágenes. Las imágenes backscattering se tomaron situando cada naranja manualmente en el sistema de imagen con la zona dañada hacia la cámara. En total se adquirieron cinco imágenes para cada uno de los 100 frutos, lo que constituye una base de datos de 500 imágenes backscattering.
Figura 2a: Ejemplo de imagen backscattering.
Figura 2b: Esquema del sistema de adquisición de imagen. 1: cámara CCD; 2: láser; 3: fruta; 4: ordenador.
Función para describir los perfiles backscattering
Las imágenes backscattering tienen simetría radial con respecto al punto de incidencia de luz (Fig. 2a), por lo cual, éstas se redujeron mediante promediado radial a un perfil monodimensional (Lu, 2004). La intensidad radial de los perfiles backscattering se obtuvo mediante el cálculo del valor medio de todos los píxeles dentro de cada anillo circular de un píxel de anchura. Los perfiles backscattering se pueden usar de forma directa como un vector de características en un clasificador para predecir la presencia de daños en la piel de la fruta. Sin embargo, para obtener predicciones más rápidas y robustas, se suele reducir el número de datos. Un método para hacer esto es encontrar los parámetros independientes de una función de distribución que describa bien los perfiles backscattering. Además, se aconseja realizar algún preprocesado a los perfiles para ajustar los perfiles backscattering con mayor precisión, como por ejemplo, la eliminación de los puntos correspondientes con el área de saturación (Peng y Lu, 2005). En este trabajo los perfiles radiales se describieron usando una función de distribución producto cruzado de Gaussiana y Lorentziana (GL), comúnmente usada en espectroscopia (Penache et at., 2002). La función GL se expresa matemáticamente con la Ecuación (1):
donde es la intensidad luminosa de cada banda circular después del promediado radial; es la distancia scattering (expresada en píxeles); es el valor asintótico de la intensidad luminosa cuando tiende a infinito; es el valor máximo de intensidad luminosa en el centro; es el centro; es el ancho total correspondiente a la mitad del máximo valor de intensidad; está relacionado con la forma, siendo de valor 0 con una función Lorentziana pura y 1 con una Gaussiana pura. La Fig. 3 muestra los puntos de un perfil backscattering y la curva ajustada obtenida con esta función de distribución. La función GL se usó para ajustar los perfiles radiales para las cinco longitudes de onda para cada fruta. Se implementó un programa basado en regresión no lineal por mínimos cuadrados (Gelman y Hill, 2006) con el objetivo de estimar los cinco parámetros GL para cada longitud de onda. Todos los algoritmos de este trabajo se implementaron usando Matlab 7.9 (Mathworks, Inc.).
Figura 3: Perfil backscattering y curva ajustada obtenida con la función de distribución producto cruzado de Gaussiana y Lorentziana.
Clasificación
En este trabajo se utilizó un clasificador basado en análisis discriminante lineal (LDA), que es una técnica de aprendizaje supervisado que se caracteriza por obtener una transformación lineal que maximiza el cociente de la varianza entre clases y la varianza entre los elementos de cada clase (Duda et al., 2001). Esta técnica estadística permite obtener un espacio vectorial transformado en el que las clases están máximamente separadas desde el punto de vista lineal. La principal diferencia con otro tipo de transformaciones como el análisis de componentes principales (PCA) es que LDA tiene en cuenta información supervisada del problema y no únicamente información sobre la distribución de los datos. Para construir el clasificador se etiquetó un conjunto de datos que constaba de 25 características asociadas a cada naranja. En concreto, cada patrón contenía los cinco parámetros de la función GL para cada longitud de onda y una clase asignada manualmente por un experto (sana y podrida). Estos datos se dividieron en dos subconjuntos: calibración (50% de las muestras) y validación (50%). El primer subconjunto se utilizó para construir el clasificador y el segundo para evaluar su rendimiento.
El clasificador LDA y los parámetros GL para las cinco longitudes de onda de láser se usaron para clasificar las frutas. Con el objetivo de encontrar la combinación de longitudes de onda de láser más adecuada para detectar podredumbres en cítricos, las longitudes de onda se ordenaron y compararon en términos de su contribución en la detección. En primer lugar, el clasificador LDA se construyó y evaluó usando como vector de características los cinco parámetros GL asociados a cada longitud de onda individualmente. Se seleccionó la longitud de onda que tenía la mayor tasa de acierto promedio del clasificador. El siguiente paso fue la obtención de la mejor combinación de dos longitudes de onda. Cada una de las restantes longitudes de onda se añadió individualmente a la mejor longitud de onda, y se calcularon las tasas de acierto para todas las combinaciones de dos longitudes de onda. Este procedimiento se repitió para obtener la mejor combinación de tres longitudes de onda, y así sucesivamente hasta que todas las longitudes de onda se ordenaron.
Resultados y discusión
La función GL describió de forma precisa los perfiles backscattering con un valor medio de R2 mayor o igual a 0,998 y un valor medio de RMSE menor o igual a 2,54 (escala de grises) para las cinco longitudes de onda de láser (Tabla 1). Estos valores se calcularon promediando los coeficientes de determinación (R2) y los valores RMSE correspondientes a las 100 naranjas para cada longitud de onda de láser.
La Tabla 2 muestra los resultados de clasificación correspondientes al conjunto de validación para las distintas combinaciones de longitudes de onda seleccionadas, incluyendo las tasas de acierto promedio del clasificador, así como de las matrices de confusión. Al comparar los resultados de clasificación, se observa que la menor tasa de acierto promedio del clasificador se obtuvo usando una única longitud de onda (80,4%). Por otra parte, los mejores resultados se consiguieron utilizando cinco longitudes de onda con una tasa de acierto promedio del 96,1%. La matriz de confusión para el clasificador usando todas las longitudes de onda muestra que el número de frutas bien clasificadas era superior al 95% para ambas clases, a pesar de la gran similitud entre naranjas sanas y podridas.
Además, el incremento de la tasa de acierto fue del 10% al pasar de una única longitud de onda a la combinación de dos longitudes de onda (90,2%). A partir de las correspondientes matrices de confusión, se puede observar que la clasificación de naranjas podridas mejoró mucho para la combinación de dos longitudes de onda, incrementando de un 74,1% a un 92,6%, mientras que el número de naranjas sanas bien clasificadas permaneció constante (87,5%) en ambos casos. En la práctica, esta reducción del número de naranjas podridas mal clasificadas tiene mucha importancia para la implementación de sistemas de inspección, puesto que un número reducido de frutas infectadas puede contaminar una partida completa provocando grandes pérdidas económicas. Por otra parte, para el resto de casos, de una combinación de longitudes de onda a otra, el incremento en la tasa de acierto es sólo del 2% al añadir una longitud de onda más.
Tabla 2: Resultados de clasificación para las combinaciones de longitudes de onda seleccionadas.
Conclusiones
En la clasificación de naranjas sanas y podridas, todas las longitudes de onda contribuyeron a la mayor tasa de acierto promedio del 96,1%. También se debe destacar el incremento de la tasa de acierto promedio del 10% al pasar de una única longitud de onda (80,4%) a la combinación de dos longitudes de onda (90,2%). Por lo tanto, puede considerarse que la detección temprana de frutas podridas mediante la técnica de imagen basada en backscattering tiene un gran potencial para ser integrada en un sistema comercial. No obstante, para una futura implementación en una línea de confección, quizás se debería utilizar un láser lineal sobre frutas en rotación.
Agradecimientos
Este trabajo está parcialmente financiado por el Instituto Nacional de Investigación y Tecnología Agraria y Alimentaria (INIA) a través del proyecto RTA2012-00062-C04-01.
Bibliografía
- Birth, G.S. (1976). How light interacts with foods. En: Gafney J.Jr.(Ed.), Quality Detection in Foods, ASAE, St. Joseph, USA, pp. 6-11.
- Blanc, P.G.R, Blasco, J., Moltó, E., Gómez-Sanchis, J., Cubero, S. (2010). Patente ES 2324324-B1. Sistema para la separación selectiva automática de cítricos afectados por podredumbre.
- Cubero, S., Aleixos, N., Moltó, E., Gómez-Sanchis, J., Blasco, J. (2011). Advances in machine vision applications for automatic inspection and quality evaluation of fruits and vegetables. Food and Bioprocess Technology 4(4), 487-504.
- Duda, R.O., Hart, P.E., Stork, D.G. (2001). Pattern Classification (second edition). Wiley-Interscience.
- Gelman, A., Hill, J. (2006). Data analysis using regression and multilevel/hierarchical models. Cambridge University Press.
- Kurita, M., Kondo, N., Shimizu, H., Ling, P., Falzea, P.D., Shiigi, T., Ninomiya, K., Nishizu, T., Yamamoto, K. (2009). A double image acquisition system with visible and UV LEDs for citrus fruit. Journal of Robotics and Mechatronics 21(4), 533–540.
- Lorente, D., Aleixos, N., Gómez-Sanchis, J., Cubero, S., García-Navarrete, O.L., Blasco, J. (2012). Recent advances and applications of hyperspectral imaging for fruit and vegetable quality assessment. Food and Bioprocess Technology 5(4), 1121-1142.
- Lu, R. (2004). Multispectral imaging for predicting firmness and soluble solids content of apple fruit. Postharvest Biology and Technology 31, 147–157.
- Navarro, L., Pina, J.A., Juarez, J., Ballester-Olmos, J.F., Arregui, J.M., Ortega, C., Navarro, A., Duran-Vila, N., Guerri, J., Moreno, P., Cambra, M., Zaragoza, S. (2002). The citrus variety improvement program in Spain in the period 1975–2001. En: Proceedings of the 15th Conference of the International Organization of Citrus Virologists. IOCV, Riverside, pp. 306–316.
- Palou, L., Smilanick, J.L., Usall, J., Viñas, I. (2001). Control postharvest blue and green molds of oranges by hot water, sodium carbonate, and sodium bicarbonate. Plant Disease 85, 371–376.
- Palou, L., Smilanick, J.L., Montesinos-Herrero, C., Valencia-Chamorro, S., Pérez-Gago, M.B. (2011). Novel approaches for postharvest preservation of fresh citrus fruits. En: Slaker, D.A. (Ed.), Citrus Fruits: Properties, Consumption and Nutrition, Nova Science Publishers, Inc., New York, USA, pp. 1-45.
- Penache, C., Miclea, M., Bräuning-Demian, A., Hohn, O., Schössler, S., Jahnke, T., Niemax, K., Schmidt-Böcking, H. (2002). Characterization of a high-pressure microdischarge using diode laser atomic absorption spectroscopy. Plasma Sources Science and Technology 11(4), 476-483.
- Peng, Y., Lu, R. (2005). Modeling multispectral scattering profiles for prediction of apple fruit firmness. Transactions of the ASAE 48, 235–242.
- Qing, Z., Ji, B., Zude, M. (2007). Predicting soluble solid content and firmness in apple fruit by means of laser light backscattering image analysis. Journal of Food Engineering 82, 58–67.