Índice

Distancias Distancia

En función de la naturaleza del problema que se ha de tratar, a menudo resulta conveniente utilizar una distancia específica para tratar los datos considerados. No dude en ser creativo a este respecto. Las siguientes líneas le ayudarán a obtener inspiración. Sepa que existen muchas distancias sobre temas muy variados. Cuando se aborda un nuevo problema, a menudo resulta útil realizar una búsqueda sobre las distancias (y las distribuciones, por otro lado) que otros han utilizado para resolver problemas similares.

La base

d no negativa

images/eq1080.PNG

d(x,y) = d(y,x)

d(x,x) = 0

images/eq1081.PNG

En ocasiones, estas condiciones no se cumplen al 100 %, se definen entonces «casi» distancias o métricas (pseudo..., semi...) cuyos detalles se salen del marco de este anexo.

Distancias y Similaridadessimilaridades

s no negativa es una similaridad:

s(x,y) = s(y,x)

images/eq1082.PNG

s(x,) = s(x,x) ssi x = y

supongamos s(.,.) comprendida entre 0 y 1, entonces podemos crear diferentes distancias:

images/eq1083.PNG
images/eq1084.PNG
images/eq1085.PNG
images/eq1086.PNG
images/eq1087.PNG
images/eq1088.PNG

Jaccard Jaccard

Distancia (y similaridad) de Jaccard entre dos conjuntos de elementos A y B:

images/eq1089.PNG
images/eq1090.PNG

Resulta muy útil para el NLPNLP.

Distancia propia de una norma

Existen muchas normas y, por tanto, muchas distancias naturales asociadas. Siempre tenemos la posibilidad de crear una distancia natural asociada:

images/eq1091.PNG

También podemos crear una distancia normalizada asociada:

images/eq1092.PNG

Diferencia simétrica semimétrica Diferencia simétrica semimétrica

Se supone que disponemos de una medida finita images/eq40.png sobre los conjuntos (como la cardinalidad ...