@asalber

Dissimilarity Measure for Collections of Objects and Values.

, and . Advances in Intelligent Data Analysis, Reasoning about Data, Second International Symposium, IDA-97, volume 1280 of Lecture Notes in Computer Science, Berlin, Germany, page 259-272. London, United Kingdom, Springer, (1997)

Abstract

Se presenta una medida de similitud entre objetos de distintos tipos, que pueden incluir atributos multivalorados como conjuntos y listas. Se parte de una medida de similitud topológica basada en dos distancias: -Una distancia de bajo nivel que compara los atributos construyendo una taxonomía sobre el conjunto de posibles valores (tanto tipos básicos como otros objetos) y midiendo caminos mínimos en la taxonomía. -Una distancia de alto nivel que agrega las distancias de bajo nivel normalizadas calculadas sobre cada atributo, asignando un peso a cada atributo. Para extender la medida a atributos cuyos valores son conjuntos, se establece un emparejamiento entre los elementos de los conjuntos y se calcula el promedio de la distancia de cada par de elementos emparejados, tomando la distancia entre los desemparejados como 1. La distancia se obtiene a partir del emparejamiento óptimo, que será el que de el menor promedio. La búsqueda de tal emparejamiento es un problema de coste cúbico. Para las listas, se utiliza la misma idea pero el emparejamiento además debe respetar el orden entre los elementos de las listas.

Description

dblp

Links and resources

Tags

community

  • @asalber
  • @dblp
@asalber's tags highlighted