Distancias Distancia
En función de la naturaleza del problema que se va a procesar, a menudo es conveniente utilizar una distancia específica para procesar los datos que se están considerando. Siéntase libre de ser creativo en este punto. Las siguientes líneas le pueden inspirar. Sepa que hay cientos de distancias sobre temas muy variados. Al abordar un problema nuevo, a menudo es muy útil investigar las distancias (y las distribuciones) que otros han utilizado en temas similares.
La base
d no negativa
d(x,y) = d(y,x)
d(x,x) = 0
En ocasiones, estas condiciones no se cumplen al 100 %, por lo que se definen «casi» distancias o métricas (pseudo..., semi...) cuyo detalle quedaría fuera del alcance de este anexo.
Distancias y similitudes Similitudes
s no negativo es una similitud:
s(x,y) = s(y,x)
s(x,) = s(x,x) ssi x = y
supongamos s(.,.) entre 0 y 1, entonces podemos crear diferentes distancias:
Jaccard Jaccard
Distancia de Jaccard (y similitud) entre dos conjuntos de elementos A y B:
Muy útil para el NLP. NLP
Distancia resultado de una norma
Hay muchos estándares y, por lo tanto, muchas distancias naturales asociadas. Siempre tenemos la posibilidad de crear una distancia natural asociada:
También puede crear una distancia normalizada asociada:
Diferencia simétrica semimétrica Diferencia simétrica semimétrica
Supongamos que disponemos de una medida finita
sobre conjuntos (como la cardinalidad de estos
conjuntos denotada|.|).
Siendo
la diferencia simétrica...