copy delete add this publication to your clipboard
community post
history of this post
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

COMA: a system for flexible combination of schema matching approaches

H. Do, and E. Rahm. Proceedings of the 28th international conference on Very Large Data Bases, page 610--621. Hong Kong, China, VLDB Endowment, (2002)

Abstract

COMA (Combining Match) es un sistema de detección de correspondencias entre esquemas (bases de datos u ontologías) basado en la combinación de distintas técnicas o algoritmos. Funciona iterativamente en tres etapas que pueden reiterarse: 1- Retroalimentación del usuario. Esta fase es opcional y permite que el usuario establezca correspondencias que después influirán en el cálculo de nuevas correspondencias en las siguientes etapas. 2- Utilización de distintos algoritmos de cálculo de similitudes para cada par de entidades de los esquemas. Se utilizan distintos tipos de algoritmos: sufijos, afijos, n-gramas, distancia de edición, fonéticos, sinónimos, tipos de datos, relaciones taxonómicas y correspondencias con terceros esquemas. Las medidas de similitud de cada algoritmo para cada par de entidades se organizan en un cubo de similitudes. 3- Combinación de similitudes. Para cada par de entidades de los esquemas se agregan las medidas de similitud de los diferentes algoritmos utilizados. Se utiliza el máximo, el mínimo y la media ponderada como posibles medidas de agregación. Después se ordenan los candidatos por similitudes y se seleccionan los candidatos de acuerdo a distintos filtros: los n candidatos más parecidos, los candidatos que estén a una distancia d menor del más parecido, y los que superen un determinado umbral de similitud. La evaluación de las correspondencias obtenidas se realiza comparando con correspondencias hechas a mano mediante las medidas de precisión, recuerdo, y una combinación de ambas. La combinación de algoritmos y la reutilización de correspondencias externas mejora sensiblemente los resultados.

Links and resources

BibTeX key: hong-hai2002coma
entry type: inproceedings
address: Hong Kong, China
booktitle: Proceedings of the 28th international conference on Very Large Data Bases
year: 2002
pages: 610--621
publisher: VLDB Endowment
url: http://portal.acm.org/citation.cfm?id=1287369.1287422

@asalber's tags highlighted

Cite this publication

%0 Conference Paper %1 hong-hai2002coma %A Do, Hong-Hai %A Rahm, Erhard %B Proceedings of the 28th international conference on Very Large Data Bases %C Hong Kong, China %D 2002 %I VLDB Endowment %K 2 matching systems ontology-alignment %P 610--621 %T COMA: a system for flexible combination of schema matching approaches %U http://portal.acm.org/citation.cfm?id=1287369.1287422 %X COMA (Combining Match) es un sistema de detección de correspondencias entre esquemas (bases de datos u ontologías) basado en la combinación de distintas técnicas o algoritmos. Funciona iterativamente en tres etapas que pueden reiterarse: 1- Retroalimentación del usuario. Esta fase es opcional y permite que el usuario establezca correspondencias que después influirán en el cálculo de nuevas correspondencias en las siguientes etapas. 2- Utilización de distintos algoritmos de cálculo de similitudes para cada par de entidades de los esquemas. Se utilizan distintos tipos de algoritmos: sufijos, afijos, n-gramas, distancia de edición, fonéticos, sinónimos, tipos de datos, relaciones taxonómicas y correspondencias con terceros esquemas. Las medidas de similitud de cada algoritmo para cada par de entidades se organizan en un cubo de similitudes. 3- Combinación de similitudes. Para cada par de entidades de los esquemas se agregan las medidas de similitud de los diferentes algoritmos utilizados. Se utiliza el máximo, el mínimo y la media ponderada como posibles medidas de agregación. Después se ordenan los candidatos por similitudes y se seleccionan los candidatos de acuerdo a distintos filtros: los n candidatos más parecidos, los candidatos que estén a una distancia d menor del más parecido, y los que superen un determinado umbral de similitud. La evaluación de las correspondencias obtenidas se realiza comparando con correspondencias hechas a mano mediante las medidas de precisión, recuerdo, y una combinación de ambas. La combinación de algoritmos y la reutilización de correspondencias externas mejora sensiblemente los resultados.

@inproceedings{hong-hai2002coma, abstract = {COMA (Combining Match) es un sistema de detección de correspondencias entre esquemas (bases de datos u ontologías) basado en la combinación de distintas técnicas o algoritmos. Funciona iterativamente en tres etapas que pueden reiterarse: 1- Retroalimentación del usuario. Esta fase es opcional y permite que el usuario establezca correspondencias que después influirán en el cálculo de nuevas correspondencias en las siguientes etapas. 2- Utilización de distintos algoritmos de cálculo de similitudes para cada par de entidades de los esquemas. Se utilizan distintos tipos de algoritmos: sufijos, afijos, n-gramas, distancia de edición, fonéticos, sinónimos, tipos de datos, relaciones taxonómicas y correspondencias con terceros esquemas. Las medidas de similitud de cada algoritmo para cada par de entidades se organizan en un cubo de similitudes. 3- Combinación de similitudes. Para cada par de entidades de los esquemas se agregan las medidas de similitud de los diferentes algoritmos utilizados. Se utiliza el máximo, el mínimo y la media ponderada como posibles medidas de agregación. Después se ordenan los candidatos por similitudes y se seleccionan los candidatos de acuerdo a distintos filtros: los n candidatos más parecidos, los candidatos que estén a una distancia d menor del más parecido, y los que superen un determinado umbral de similitud. La evaluación de las correspondencias obtenidas se realiza comparando con correspondencias hechas a mano mediante las medidas de precisión, recuerdo, y una combinación de ambas. La combinación de algoritmos y la reutilización de correspondencias externas mejora sensiblemente los resultados. }, added-at = {2009-06-22T17:44:00.000+0200}, address = {Hong Kong, China}, author = {Do, Hong-Hai and Rahm, Erhard}, biburl = {https://www.bibsonomy.org/bibtex/2e2b435f1a7cd2d0018aa34ed415b8c84/asalber}, booktitle = {Proceedings of the 28th international conference on Very Large Data Bases}, interhash = {1e5c80af6ad93ec5c46e8be9252088b5}, intrahash = {e2b435f1a7cd2d0018aa34ed415b8c84}, keywords = {2 matching systems ontology-alignment}, pages = {610--621}, publisher = {VLDB Endowment}, timestamp = {2012-06-07T11:07:57.000+0200}, title = {COMA: a system for flexible combination of schema matching approaches}, url = {http://portal.acm.org/citation.cfm?id=1287369.1287422}, year = 2002 }

BibSonomy

copy delete add this publication to your clipboard
community post
history of this post
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

COMA: a system for flexible combination of schema matching approaches

Abstract

Links and resources

Tags

community

Cite this publication

More citation styles

search on

Meta data

Comments and Reviews
(0)

BibSonomy

copydeleteadd this publication to your clipboardcommunity posthistory of this postURLDOIBibTeXEndNoteAPAChicagoDIN 1505HarvardMSOffice XML COMA: a system for flexible combination of schema matching approaches

Abstract

Links and resources

Tags

community

Cite this publication

More citation styles

search on

Meta data

Comments and Reviews (0)

copy delete add this publication to your clipboard
community post
history of this post
URL
DOI
BibTeX
EndNote
APA
Chicago
DIN 1505
Harvard
MSOffice XML

COMA: a system for flexible combination of schema matching approaches

Comments and Reviews
(0)