• Treffer 1 von 1
Zurück zur Trefferliste

Gruppierung von Daten

  • Dieser Beitrag beinhaltet einen Vergleich zwischen den Methoden der Topologischen Datenanalyse (TDA) und statistischen Clusterverfahren bei der Gruppierung von Daten. Es werden Gemeinsamkeiten und Unterschiede bei der Bildung der Cluster und Zuordnung der statistischen Einheiten identifiziert. Hierzu werden zwei empirische Datensätze aus der Biologie und Medizin herangezogen. Zusammengefasst haben sich die Verfahren der TDA als ein praktikables Werkzeug bei der Gruppierung von Objekten erwiesen. Vor allem mit dem Mapper-Algorithmus konnten adäquate Cluster erkannt werden. Beim Iris Flower-Datensatz hat die TDA ähnliche Ergebnisse wie die Clusteranalyse erzielt. Der Heart Disease-Datensatz war schwieriger zu behandeln. Die genutzten clusteranalytischen Verfahren waren nicht geeignet, die beiden Gruppen von Patienten korrekt zu identifizieren. Im Vergleich zu den Standardverfahren der Clusteranalyse zeigte sich eine leichte Überlegenheit der topologischen Verfahren.
  • This paper includes a comparison between Topological Data Analysis (TDA) methods and statistical clustering methods in grouping data. Similarities and differences in the formation of clusters and assignment of statistical units are identified. Two empirical data sets from biology and medicine are used for this purpose. In summary, the procedures of TDA have proven to be a viable tool in grouping objects. Especially with the mapper algorithm adequate clusters could be detected. For the Iris Flower-dataset, TDA produced similar results to cluster analysis. The Heart Disease-dataset was more difficult to deal with. The used cluster analytic techniques are not capable of correctly identifying the two groups of patients. Compared with the standard cluster analysis methods, the topological procedures showed a slight superiority.

Volltext Dateien herunterladen

  • SHA-512:9876dbf758a23ebdebe49b441856185f50a11ea541c5df92f7d1e1e2d7aa597bd8838556334f46faca40f35db8ef75f80f91b063f7227da2b9bb04179b87953f

Metadaten exportieren

Metadaten
Verfasserangaben:Andreas NastanskyGND
URN:urn:nbn:de:kobv:517-opus4-572722
DOI:https://doi.org/10.25932/publishup-57272
Titel des übergeordneten Werks (Deutsch):Statistische Diskussionsbeiträge
Untertitel (Deutsch):Topologische Verfahren vs. Clusteranalyse
Schriftenreihe (Bandnummer):Statistische Diskussionsbeiträge (55)
Publikationstyp:Arbeitspapier
Sprache:Deutsch
Datum der Erstveröffentlichung:02.01.2023
Erscheinungsjahr:2022
Veröffentlichende Institution:Universität Potsdam
Datum der Freischaltung:02.01.2023
Freies Schlagwort / Tag:Clusteranalyse; Mapper; Persistente Homologie; Topologische Datenanalyse
Ausgabe:55
Seitenanzahl:26
RVK - Regensburger Verbundklassifikation:QH 200
Organisationseinheiten:Extern
DDC-Klassifikation:3 Sozialwissenschaften / 31 Statistiken / 310 Sammlungen allgemeiner Statistiken
3 Sozialwissenschaften / 33 Wirtschaft / 330 Wirtschaft
Peer Review:Nicht referiert
Lizenz (Deutsch):License LogoKeine öffentliche Lizenz: Unter Urheberrechtsschutz
Verstanden ✔
Diese Webseite verwendet technisch erforderliche Session-Cookies. Durch die weitere Nutzung der Webseite stimmen Sie diesem zu. Unsere Datenschutzerklärung finden Sie hier.