Das Suchergebnis hat sich seit Ihrer Suchanfrage verändert. Eventuell werden Dokumente in anderer Reihenfolge angezeigt.
  • Treffer 27 von 404
Zurück zur Trefferliste

Discovering relaxed functional dependencies based on multi-attribute dominance

  • With the advent of big data and data lakes, data are often integrated from multiple sources. Such integrated data are often of poor quality, due to inconsistencies, errors, and so forth. One way to check the quality of data is to infer functional dependencies (fds). However, in many modern applications it might be necessary to extract properties and relationships that are not captured through fds, due to the necessity to admit exceptions, or to consider similarity rather than equality of data values. Relaxed fds (rfds) have been introduced to meet these needs, but their discovery from data adds further complexity to an already complex problem, also due to the necessity of specifying similarity and validity thresholds. We propose Domino, a new discovery algorithm for rfds that exploits the concept of dominance in order to derive similarity thresholds of attribute values while inferring rfds. An experimental evaluation on real datasets demonstrates the discovery performance and the effectiveness of the proposed algorithm.

Metadaten exportieren

Weitere Dienste

Suche bei Google Scholar Statistik - Anzahl der Zugriffe auf das Dokument
Metadaten
Verfasserangaben:Loredana CaruccioORCiD, Vincenzo DeufemiaORCiD, Felix NaumannORCiDGND, Giuseppe PoleseORCiD
DOI:https://doi.org/10.1109/TKDE.2020.2967722
ISSN:1041-4347
ISSN:1558-2191
Titel des übergeordneten Werks (Englisch):IEEE transactions on knowledge and data engineering
Verlag:Institute of Electrical and Electronics Engineers
Verlagsort:New York, NY
Publikationstyp:Wissenschaftlicher Artikel
Sprache:Englisch
Datum der Erstveröffentlichung:17.01.2020
Erscheinungsjahr:2021
Datum der Freischaltung:13.07.2023
Freies Schlagwort / Tag:Approximation algorithms; Big Data; Complexity theory; Distributed; Functional dependencies; Lakes; Semantics; data cleansing; data profiling; databases
Band:33
Ausgabe:9
Seitenanzahl:17
Erste Seite:3212
Letzte Seite:3228
Organisationseinheiten:An-Institute / Hasso-Plattner-Institut für Digital Engineering gGmbH
DDC-Klassifikation:0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 000 Informatik, Informationswissenschaft, allgemeine Werke
5 Naturwissenschaften und Mathematik / 53 Physik / 530 Physik
6 Technik, Medizin, angewandte Wissenschaften / 62 Ingenieurwissenschaften / 620 Ingenieurwissenschaften und zugeordnete Tätigkeiten
Peer Review:Referiert
Verstanden ✔
Diese Webseite verwendet technisch erforderliche Session-Cookies. Durch die weitere Nutzung der Webseite stimmen Sie diesem zu. Unsere Datenschutzerklärung finden Sie hier.