67 I+D Distancia Fórmulas Euclidean Square Euclidean City Block Minkowki Chebyshev Exponential en la selección y colocación de los sensores dentro del molde. 5.2. Medidas de similitud Las medidas de similitud se aplican sobre los datos cuan- titativos. Se implementaron y se validaron las distancias indicadas en la tabla 6. Para los atributos cualitativos, el problema es diferente. ¿Cómo se mide la distancia entre dos tipos de defectos? Los tipos de defectos son varia- bles binarias: cada defecto está presente (o no) en el caso. La distancia de dos objetos representados por las variables binarias se puede medir en términos de número de ocurrencias (frecuencia) positivas y negativas de cada objeto. Un atributo binario puede ser: Tabla 6. Distancias de similitud para los atributos cuantitativos. X e Y son vectores N-dimensionales. tivas en Obj2, s las variables negativas para ambas listas y t el número total de variables, hemos implementado las siguientes distancias: • Distancia mínima (simétrica): donde D (Obj1; Obj2) = (q +r)/t.Ennuestroejemplo,puestoqueq=2,r=1yt = 8, la distancia es de 0,375. • Distancia de Jaccard (asimétrica): donde D (Obj1; obj2) =(q+r)/(p+q+r).Ennuestroejemplo,puestoquep = 1 la distancia es de 0,75 Las pruebas preliminares muestran que en nuestro sis- tema, la distancia de Jaccard da mejores resultados que el método distancia mínima, ya que es más importante que un defecto a evitar esté presente en un caso. 5.3. Recuperar los casos El algoritmo de recuperación para nuestra aplicación CBR sigue la estructura estándar, y se muestra en el algoritmo 1. Se muestra el algoritmo utilizando la distancia de Jac- card para los atributos cualitativos y la distancia euclídea de los atributos cuantitativos. En función de las entradas, las características del perfil de los usuarios y la tipología del molde, se puede decidir qué medida de similitud es la más adecuada. Asumimos que los atributos numéricos y categóricos tie- nen el mismo peso, y por lo tanto, la función getNeares- tNeighbors suma ambos valores cuando seleccionamos los casos más cercanos. Dicha selección devuelve los NN casos con menor distancia (NN es variable). PLASTICOS ——— ———— • Simétrico: Cuando los dos estados (0 y 1) tienen la misma importancia, y llevar el mismo peso, por ejem- plo, un atributo que representa el género de una perso- na (masculino/femenino). • Asimétrico: Si uno de los estados es más importante que el otro. El estado 1 representa el estado más im- portante, que suele coincidir con el estado menos común. Por ejemplo, supongamos que tenemos las siguientes dos listas de defectos que deben evitarse: Sing Marks Warpage Obj1 Obj2 Algoritmo 1, de obtención CBR Datos: De entrada cuantitativos: F, L, W,T , DS, #C Datos: Listar defectos a evitar: LDEF, EC, T S[] Datos: Listar casos en la base de datos C, B[] Datos: Número de casos obtenido N N Resultado: Lista de los NN casos más parecidos LL[] fori⇐1tosize(CB)do dDefects[] = getDistance Jaccard(C B[i], LDEF.EC.T.S); dOther[] = getDistanceEuclidean(C B[i], [F L, W T , DS, #C ]); end ind = get N earest N eighbors(dDef ects + dOther, N N ); LL = retreiveC ases(C B, ind); Return LL; Diesel Jetting Weld Inc. lines Filled Obj1 está representada por el vector (0, 1, 0, 1, 0, 1, 0, 0) y Obj2 con el vector (1, 1; 0; 0; 0; 0; 0; 0). Entonces, sea p el número de variables positivas en ambas listas, q el número de variables positivas en Obj1 pero no en Obj2, r el número de variables negativas en Obj1 que son posi- UNIVERSALES tecnología