@techreport{Nastansky2022, type = {Working Paper}, author = {Nastansky, Andreas}, title = {Gruppierung von Daten}, series = {Statistische Diskussionsbeitr{\"a}ge}, journal = {Statistische Diskussionsbeitr{\"a}ge}, number = {55}, doi = {10.25932/publishup-57272}, url = {http://nbn-resolving.de/urn:nbn:de:kobv:517-opus4-572722}, pages = {26}, year = {2022}, abstract = {Dieser Beitrag beinhaltet einen Vergleich zwischen den Methoden der Topologischen Datenanalyse (TDA) und statistischen Clusterverfahren bei der Gruppierung von Daten. Es werden Gemeinsamkeiten und Unterschiede bei der Bildung der Cluster und Zuordnung der statistischen Einheiten identifiziert. Hierzu werden zwei empirische Datens{\"a}tze aus der Biologie und Medizin herangezogen. Zusammengefasst haben sich die Verfahren der TDA als ein praktikables Werkzeug bei der Gruppierung von Objekten erwiesen. Vor allem mit dem Mapper-Algorithmus konnten ad{\"a}quate Cluster erkannt werden. Beim Iris Flower-Datensatz hat die TDA {\"a}hnliche Ergebnisse wie die Clusteranalyse erzielt. Der Heart Disease-Datensatz war schwieriger zu behandeln. Die genutzten clusteranalytischen Verfahren waren nicht geeignet, die beiden Gruppen von Patienten korrekt zu identifizieren. Im Vergleich zu den Standardverfahren der Clusteranalyse zeigte sich eine leichte {\"U}berlegenheit der topologischen Verfahren.}, language = {de} }