91 Figura 3: Perfil backscattering y curva ajustada obtenida con la función de distribución producto cruzado de Gaussiana y Lorentziana. tivo de estimar los cinco parámetros GL para cada longitud de onda. Todos los algoritmos de este trabajo se implementaron usando Matlab 7.9 (Mathworks, Inc.). Clasificación En este trabajo se utilizó un clasifi- cador basado en análisis discrimi- nante lineal (LDA), que es una técnica de aprendizaje supervisado que se caracteriza por obtener una transformación lineal que maximiza el cocien- te de la varianza entre clases y la varianza entre los ele- mentos de cada clase (Duda et al., 2001). Esta técnica estadística permite obtener un espacio vectorial transfor- mado en el que las clases están máximamente separadas desde el punto de vista lineal. La principal diferencia con otro tipo de transformaciones como el análisis de compo- nentes principales (PCA) es que LDA tiene en cuenta in- formación supervisada del problema y no únicamente información sobre la distribución de los datos. Para cons- truir el clasificador se etiquetó un conjunto de datos que constaba de 25 características asociadas a cada naranja. En concreto, cada patrón contenía los cinco parámetros de la función GL para cada longitud de onda y una clase asig- nada manualmente por un experto (sana y podrida). Estos datos se dividieron en dos subconjuntos: calibración (50% de las muestras) y validación (50%). El primer subconjunto se utilizó para construir el clasificador y el segundo para evaluar su rendimiento. El clasificador LDA y los parámetros GL para las cinco lon- gitudes de onda de láser se usaron para clasificar las frutas. Con el objetivo de encontrar la combinación de longitudes de onda de láser más adecuada para detectar podredum- bres en cítricos, las longitudes de onda se ordenaron y compararon en términos de su contribución en la detec- ción. En primer lugar, el clasificador LDA se construyó y evaluó usando como vector de características los cinco pa- rámetros GL asociados a cada longitud de onda individual- mente. Se seleccionó la longitud de onda que tenía la mayor tasa de acierto promedio del clasificador. El siguien- te paso fue la obtención de la mejor combinación de dos longitudes de onda. Cada una de las restantes longitudes de onda se añadió individualmente a la mejor longitud de onda, y se calcularon las tasas de acierto para todas las combinaciones de dos longitudes de onda. Este procedi- miento se repitió para obtener la mejor combinación de tres longitudes de onda, y así sucesivamente hasta que todas las longitudes de onda se ordenaron. Resultados y discusión La función GL describió de forma precisa los perfiles backscattering con un valor medio de R2 mayor o igual a 0,998 y un valor medio de RMSE menor o igual a 2,54 (es- cala de grises) para las cinco longitudes de onda de láser (Tabla 1). Estos valores se calcularon promediando los co- eficientes de determinación (R2) y los valores RMSE co- rrespondientes a las 100 naranjas para cada longitud de onda de láser. La Tabla 2 muestra los resultados de clasifi- cación correspondientes al conjunto de validación para las distintas combinaciones de longitudes de onda seleccio- nadas, incluyendo las tasas de acierto promedio del clasi- ficador, así como de las matrices de confusión. Al comparar los resultados de clasificación, se observa que la menor tasa de acierto promedio del clasificador se ob- tuvo usando una única longitud de onda (80,4%). Por otra parte, los mejores resultados se consiguieron utilizando cinco longitudes de onda con una tasa de acierto promedio del 96,1%. La matriz de confusión para el clasificador usan- do todas las longitudes de onda muestra que el número de frutas bien clasificadas era superior al 95% para ambas clases, a pesar de la gran similitud entre naranjas sanas y podridas. Además, el incremento de la tasa de acierto fue del 10% al pasar de una única longitud de onda a la combinación de dos longitudes de onda (90,2%). A partir de las correspon- dientes matrices de confusión, se puede observar que la clasificación de naranjas podridas mejoró mucho para la combinación de dos longitudes de onda, incrementando de un 74,1% a un 92,6%, mientras que el número de na- ranjas sanas bien clasificadas permaneció constante (87,5%) en ambos casos. En la práctica, esta reducción del número de naranjas podridas mal clasificadas tiene mucha importancia para la implementación de sistemas de ins- poscosecha