• search hit 49 of 244
Back to Result List

Informationsqualität : Antrittsvorlesung 2007-04-26

  • Sowohl in kommerziellen als auch in wissenschaftlichen Datenbanken sind Daten von niedriger Qualität allgegenwärtig. Das kann zu erheblichen wirtschaftlichen Problemen führen", erläutert der 35-jährige Informatik-Professor und verweist zum Beispiel auf Duplikate. Diese können entstehen, wenn in Unternehmen verschiedene Kundendatenbestände zusammengefügt werden, aber die Integration mehrere Datensätze des gleichen Kunden hinterlässt. "Solche doppelten Einträge zu finden, ist aus zwei Gründen schwierig: Zum einen ist die Menge der Daten oft sehr groß, zum anderen können sich Einträge über die gleiche Person leicht unterscheiden", beschreibt Prof. Naumann häufig auftretende Probleme. In seiner Antrittsvorlesung will er zwei Lösungswege vorstellen: Erstens die Definition geeigneter Ähnlichkeitsmaße und zweitens die Nutzung von Algorithmen, die es vermeiden, jeden Datensatz mit jedem anderen zu vergleichen. Außerdem soll es um grundlegende Aspekte der Verständlichkeit, Objektivität, Vollständigkeit und Fehlerhaftigkeit von Daten gehen.

Export metadata

Additional Services

Share in Twitter Search Google Scholar Statistics
Metadaten
Author:Felix NaumannORCiDGND
URL:http://info.ub.uni-potsdam.de/multimedia/show_projekt.php?projekt_id=9
Publisher:Univ.-Bibl.
Place of publication:Potsdam
Document Type:Monograph/Edited Volume
Language:German
Year of first Publication:2008
Year of Completion:2008
Release Date:2017/03/25
Organizational units:Mathematisch-Naturwissenschaftliche Fakultät / Institut für Informatik und Computational Science
Institution name at the time of publication:Mathematisch-Naturwissenschaftliche Fakultät / Institut für Informatik