Topologische Datenanalyse

  • Bei der Analyse von höherdimensionalen Daten kann deren Gestalt wichtige Informationen über den Datensatz liefern. Bei einer gegebenen Punktwolke, die aus einem unbekannten topologischen Raum ausgewählt wurde, versucht die Topologische Datenanalyse (TDA) den ursprünglichen Raum zu rekonstruieren. Dieser Beitrag soll eine Einführung in die Topologische Datenanalyse geben und konzentriert sich dabei auf zwei wichtige Aspekte: die Persistente Homologie und den Mapper. Dabei werden zuerst die notwendigen theoretischen Grundlagen vorgestellt und anschließend wird die Methodik bei der Visualisierung von Daten eingesetzt. Die Persistente Homologie ist eines der Standardwerkzeuge in der TDA. Sie findet ihre Anwendung beispielsweise in den Bereichen Formerkennung und -beschreibung. Der Mapper als zweites wichtiges Konzept der TDA wandelt umfangreiche, höherdimensionale Datensätze in Simplizialkomplexe um und kann dadurch geometrische und topologische Eigenschaften der Daten bestimmen. Des Weiteren ist die Mapper-Methode ein brauchbaresBei der Analyse von höherdimensionalen Daten kann deren Gestalt wichtige Informationen über den Datensatz liefern. Bei einer gegebenen Punktwolke, die aus einem unbekannten topologischen Raum ausgewählt wurde, versucht die Topologische Datenanalyse (TDA) den ursprünglichen Raum zu rekonstruieren. Dieser Beitrag soll eine Einführung in die Topologische Datenanalyse geben und konzentriert sich dabei auf zwei wichtige Aspekte: die Persistente Homologie und den Mapper. Dabei werden zuerst die notwendigen theoretischen Grundlagen vorgestellt und anschließend wird die Methodik bei der Visualisierung von Daten eingesetzt. Die Persistente Homologie ist eines der Standardwerkzeuge in der TDA. Sie findet ihre Anwendung beispielsweise in den Bereichen Formerkennung und -beschreibung. Der Mapper als zweites wichtiges Konzept der TDA wandelt umfangreiche, höherdimensionale Datensätze in Simplizialkomplexe um und kann dadurch geometrische und topologische Eigenschaften der Daten bestimmen. Des Weiteren ist die Mapper-Methode ein brauchbares Werkzeug zur Visualisierungen von mehrdimensionalen Daten, woran statistische Verfahren scheitern.show moreshow less
  • In the analysis of higher-dimensional data their shape can provide important information about the dataset. Given a point cloud sampled from an unknown topological space, topological data analysis tries to reconstruct the original space. This paper provides an introduction into topological data analysis (TDA) and focuses on two important aspects: Persistent Homology and Mapper. First, the theoretical basics are introduced and then the methodology is applied to visualize data. Persistent Homology represents a standard tools in the TDA. This approach is used, for example, in shape recognition and description. The Mapper is a second important concept of the TDA and converts wide, higher-dimensional datasets into simplicial complexes. By that it can determine geometric and topological properties of the data. Furthermore, the Mapper method is a useful tool for the visualization of multi-dimensional data, where statistical methods fail.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar Statistics
Metadaten
Author:Andreas NastanskyGND
URN:urn:nbn:de:kobv:517-opus4-431420
DOI:https://doi.org/10.25932/publishup-43142
Parent Title (German):Statistische Diskussionsbeiträge
Subtitle (German):Eine Einführung in die Persistente Homologie und Mapper
Series (Serial Number):Statistische Diskussionsbeiträge (53)
Document Type:Working Paper
Language:German
Date of first Publication:2019/07/12
Year of Completion:2019
Publishing Institution:Universität Potsdam
Release Date:2019/07/05
Issue:53
Pagenumber:38
RVK - Regensburg Classification:QH 200
Organizational units:Extern / Extern
Dewey Decimal Classification:3 Sozialwissenschaften / 33 Wirtschaft / 330 Wirtschaft
Peer Review:Nicht referiert
Licence (German):License LogoKeine Nutzungslizenz vergeben - es gilt das deutsche Urheberrecht