TY - RPRT A1 - Nastansky, Andreas T1 - Gruppierung von Daten BT - Topologische Verfahren vs. Clusteranalyse T2 - Statistische Diskussionsbeiträge N2 - Dieser Beitrag beinhaltet einen Vergleich zwischen den Methoden der Topologischen Datenanalyse (TDA) und statistischen Clusterverfahren bei der Gruppierung von Daten. Es werden Gemeinsamkeiten und Unterschiede bei der Bildung der Cluster und Zuordnung der statistischen Einheiten identifiziert. Hierzu werden zwei empirische Datensätze aus der Biologie und Medizin herangezogen. Zusammengefasst haben sich die Verfahren der TDA als ein praktikables Werkzeug bei der Gruppierung von Objekten erwiesen. Vor allem mit dem Mapper-Algorithmus konnten adäquate Cluster erkannt werden. Beim Iris Flower-Datensatz hat die TDA ähnliche Ergebnisse wie die Clusteranalyse erzielt. Der Heart Disease-Datensatz war schwieriger zu behandeln. Die genutzten clusteranalytischen Verfahren waren nicht geeignet, die beiden Gruppen von Patienten korrekt zu identifizieren. Im Vergleich zu den Standardverfahren der Clusteranalyse zeigte sich eine leichte Überlegenheit der topologischen Verfahren. N2 - This paper includes a comparison between Topological Data Analysis (TDA) methods and statistical clustering methods in grouping data. Similarities and differences in the formation of clusters and assignment of statistical units are identified. Two empirical data sets from biology and medicine are used for this purpose. In summary, the procedures of TDA have proven to be a viable tool in grouping objects. Especially with the mapper algorithm adequate clusters could be detected. For the Iris Flower-dataset, TDA produced similar results to cluster analysis. The Heart Disease-dataset was more difficult to deal with. The used cluster analytic techniques are not capable of correctly identifying the two groups of patients. Compared with the standard cluster analysis methods, the topological procedures showed a slight superiority. T3 - Statistische Diskussionsbeiträge - 55 KW - Clusteranalyse KW - Mapper KW - Persistente Homologie KW - Topologische Datenanalyse Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-572722 IS - 55 ER - TY - THES A1 - Williges, Esther S. G. T1 - Steuerverwaltung in Polen : eine europäische Verwaltung? [vollständige Fassung] T1 - Tax administration in Poland : a European administration? N2 - Die Arbeit geht der Frage nach, ob man die Steuerverwaltung in Polen als europäische Verwaltung bezeichnen kann. Es werden drei Aspekte vertiefend untersucht: 1.Verortung der polnischen Steuerverwaltung in der OECD und ausgewählten Nicht-OECD-Ländern mittels einer Clusteranalyse auf Grundlage verschiedener Daten zum Aufbau, Aufgabenprofil und zur Performanz unter gleichzeitiger Beachtung der möglichen Abzeichnung eines europäischen Steuerverwaltungsraums; 2.Verbreitung des CAF in den Steuerverwaltungen der MOE-8, insbesondere in Polen, als vom EUPAN unterstütztes Qualitätsmanagementsystem, das geeignet erscheint, die Entstehung eines gemeinsamen europäischen Qualitätsverständnisses zu fördern; 3.Wahrnehmung der polnischen Steuerverwaltung durch deutsche Finanzbeamte erhoben mit Hilfe eines semantischen Differentials. Die Clusteranalyse ergibt keinen Hinweis auf einen einheitlichen europäischen Steuerverwaltungsraum in Abgrenzung von den übrigen einbezogenen Staaten. Polen fällt nicht als Ausreißer auf und weist Ähnlichkeiten zu anderen europäischen Ländern auf. In Steuerverwaltungen lässt sich das CAF so gut wie gar nicht finden. Polen bildet in der Hinsicht eine Ausnahme. Allerdings befindet sich die polnische Steuerverwaltung auf einem europäischen Weg, den andere Sektoren der Verwaltung (auch in MOE-8) bereits vielfach beschritten haben. Aus der Untersuchung des Images der polnischen Steuerverwaltung bei deutschen Finanzbeamten geht die Abwesenheit starker negativer Stereotype hervor. Die Einschätzungen sind sehr zurückhaltend in der Nähe des Mittelwertes zwischen den beiden Polen des semantischen Differentials. Das vorläufige Ergebnis lautet: Die Steuerverwaltung in Polen ist eine europäische Verwaltung. N2 - This thesis discusses the question, if the Polish tax administration can be called a European administration. Three aspects are analysed: 1.Placement of the Polish tax administration among OECD and selected non-OECD countries by means of a cluster analysis based on various data concerning structure, tasks and performance with special attention to the emergence of a European administrative space of tax administrations; 2.Spread of the CAF among the tax administrations of CEE-8, especially in Poland, as quality management system supported by the EUPAN, that seems suitable to enhance the emergence of a common European unterstanding of quality; 3.Perception of the Polish tax administration by German tax collectors gathered with a semantic differential. The cluster analysis does not hint at a uniform European administrative space of tax administrations separated from the other included countries. Poland does not stand out as an outlier and shows similarities to other European countries. Hardly can the CAF be found in tax administrations. Poland is an exception. But the Polish tax administration is on a European path, which the other sectors of administration (also in CEE-8) have already followed in many cases. The absence of strong negative stereotypes among German tax collectors is a result of the analysis of the image of the Polish tax administration. The assessment is diffident near the mean value between the two poles of the semantic differential. The preliminary result is: The Polish tax administration is a European administration. KW - Polen KW - Steuerverwaltung KW - Europäisierung KW - Clusteranalyse KW - Polaritätsprofil KW - Poland KW - tax administration KW - Europeanization KW - cluster analysis KW - semantic differential Y1 - 2008 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus-33877 ER - TY - THES A1 - Schorsch, Andrea T1 - Statistische Eigenschaften von Clusterverfahren T1 - Statistical properties of cluster procedures N2 - Die vorliegende Diplomarbeit beschäftigt sich mit zwei Aspekten der statistischen Eigenschaften von Clusterverfahren. Zum einen geht die Arbeit auf die Frage der Existenz von unterschiedlichen Clusteranalysemethoden zur Strukturfindung und deren unterschiedlichen Vorgehensweisen ein. Die Methode des Abstandes zwischen Mannigfaltigkeiten und die K-means Methode liefern ausgehend von gleichen Daten unterschiedliche Endclusterungen. Der zweite Teil dieser Arbeit beschäftigt sich näher mit den asymptotischen Eigenschaften des K-means Verfahrens. Hierbei ist die Menge der optimalen Clusterzentren konsistent. Bei Vergrößerung des Stichprobenumfangs gegen Unendlich konvergiert diese in Wahrscheinlichkeit gegen die Menge der Clusterzentren, die das Varianzkriterium minimiert. Ebenfalls konvergiert die Menge der optimalen Clusterzentren für n gegen Unendlich gegen eine Normalverteilung. Es hat sich dabei ergeben, dass die einzelnen Clusterzentren voneinander abhängen. N2 - The following thesis describes two different views onto the statistical characterics of clustering procedures. At first it adresses the questions whether different clustering methods exist to ascertain the structure of clusters and in what ays the strategies of these methods differ from each other. The method of distance between the manifolds as well as the k-means method provide different final clusters based on equal initial data. The second part of the thesis concentrates on asymptotic properties of the k-means procedure. Here the amount of optimal clustering centres is consistent. If the size of the sample range is enlarged towards infinity, it also converges in probability towards the amount of clustering centres which minimized the whithin cluster sum of squares. Likewise the amount of optimal clustering centres converges for infinity towards the normal distribution. The main result shows that the individual clustering centres are dependent on each other. KW - Clusteranalyse KW - K-Means Verfahren KW - asymptotische Normalverteilung KW - cluster analysis KW - k-means clustering KW - asymptotical normal distribution Y1 - 2008 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus-29026 ER - TY - THES A1 - Barsch, Andreas T1 - Zum Einfluss von Witterung und Klima auf den Landschaftszustand und die Landschaftsentwicklung im Uvs-Nuur-Becken (NW-Mongolei) N2 - Im Landschaftszustand und in der Landschaftsentwicklung kommen funktionale Beziehungen zwischen dem naturbedingten Energie-, Wasser- und Stoffhaushalt einerseits und den Auswirkungen der Landnutzung andererseits zum Ausdruck. Gegenwärtig verändert der globale Anstieg der bodennahen Temperaturen vielerorts den landschaftlichen Energie-, Wasser- und Stoffhaushalt, wobei besonders in Trockengebieten zu erwarten ist, dass dieser Trend in Verbindung mit einer unangepassten Landnutzung das Regenerationsvermögen der Vegetation einschränkt und zur Zerstörung der Bodendecke führt. Für die Mongolei und für benachbarte Gebiete Asiens sind in Szenarien zur globalen Erwärmung hohe Werte des Temperaturanstiegs prognostiziert worden. Eine globale Einschätzung der anthropogen induzierten Bodendegradation hat diese Region als stark oder extrem stark betroffen eingestuft. Vor diesem Hintergrund wurde im Uvs-Nuur-Becken, das im Nordwesten der Mongolei und damit in einer der trockensten Regionen des Landes gelegen ist, untersucht, wie sich der globale Temperaturanstieg auf der lokalen und regionalen Ebene widerspiegelt und wie der Landschaftshaushalt dabei verändert wird. Die Auswirkungen des sommerlichen Witterungsverlaufes auf den Landschaftszustand sind 1997 bis 1999 an einem Transsekt erfasst worden, das sich zwischen dem Kharkhiraa-Gebirge am Westrand des Beckens und dem See Uvs Nuur im Beckeninneren von den Polsterfluren und Matten der alpinen Stufe über die Gebirgswaldsteppe, die Trockensteppe bis zur Halbwüste erstreckt. An neun Messpunkten wurden witterungsklimatische Daten in Verbindung mit Merkmalen der Vegetation, des Bodens und der Bodenfeuchte aufgenommen. Die im Sommer 1998 gewonnenen Messwerte wurden mit Hilfe einer Clusteranalyse gebündelt und verdichtet. Auf dieser Grundlage konnten landschaftliche Zustandsformen inhaltlich gekennzeichnet, zeitlich eingeordnet und durch Zeit-Verhaltens-Modelle (Stacks) abgebildet werden. Aus den Zeit-Verhaltens-Modellen wird ersichtlich, dass man Zustandsformen, in denen die Hitze und die Trockenheit des Sommers 1998 besonders stark zum Ausdruck kommen, an allen Messpunkten beobachten kann, nimmt man die Station auf dem fast 3.000 m hohen Gipfel des Khukh Uul sowie die grundwasserbeeinflusste Station in unmittelbarer Seenähe aus. In ihrer extremen Form sind Trockenperioden jedoch nur im Beckeninneren und am Fuß der Randgebirge, also in der Halbwüste, in der Trockensteppe und in der Wiesensteppe aufgetreten. Im Bergwald sowie im Bereich der alpinen Matten und Polsterfluren fehlen sie. Am stärksten sind die grundwasserfreien Bereiche der Halbwüste von der Hitze und Niederschlagsarmut des Sommers 1998 betroffen. An vier Fünfteln der Tage des Beobachtungszeitraumes herrscht an diesem Messpunkt extreme Trockenheit. Es fällt entweder gar kein Niederschlag oder nur so wenig, dass der seit dem Frühjahr erschöpfte Bodenwasservorrat nicht aufgefüllt wird. Das Verhältnis zwischen Niederschlag und potenzieller Verdunstung liegt hier bei 1:12. In der Halbwüste zeichnet sich eine fortschreitende Desertifikation ab, zumal hier eine nichtangepasste Weidenutzung dominiert, in der Ziegen eine immer größere Rolle spielen. Dies gilt insbesondere für Bereiche in Siedlungsnähe. Örtlich ist auch der Bestand der Trockensteppe gefährdet, die sich an die Halbwüste zum Beckenrand hin anschließt. Hier ist nicht nur die Viehdichte am höchsten, sondern hier werden auch die meisten unbefestigten Fahrwege wild angelegt und die Bodendecke damit zerstört. Dies kann im Endeffekt zu einem Übergreifen von Prozessen der Desertifikation führen. Aus methodischer Sicht zeigt sich, dass die Kennzeichnung landschaftlicher Zustandsformen durch Zeit-Verhaltens-Modelle die Ermittlung der Auswirkungen von Witterung und Klima auf den Landschaftszustand erleichtert, da sie deren Aussage konzentriert. Zur Interpretation der Ergebnisse ist jedoch ein Rückgriff auf die beschreibende Darstellung der Messwerte notwendig. Die im westlichen Uvs-Nuur-Becken und seinen Randgebirgen angewandte Verfahrensweise ermöglicht es, globale Aussagen zur globalen Erwärmung der Kontinente regional oder lokal zu überprüfen und zu untersetzen." N2 - Landscape condition and landscape development express the functional relations between energy balance, water balance and material balance on the one hand and on the other hand they reflect the effects of land use. At present the global increase of near-surface air temperature changes the energy balance, water balance and material balance in many places. Especially in arid regions this trend and an inappropriate land use restrict the regeneration ability of vegetation and lead to the degradation of soil cover. Different scenarios for global warming prognosticate high values of increasing air temperature in Mongolia and its adjacent regions in Asia. A global estimation of anthropogenicly induced soil degradation classifies this region as strongly or extremely strong affected. Against this background a research was carried out in the Uvs Nuur Basin, placed in the northwest of Mongolia and therefore in one of the most arid regions of this country. The object of investigation was the reflection of the global increase of air temperature on a local and regional level and the resulting changes of landscape balance. From 1997 to 1999 the effects of changes in summer weather on the landscape condition were measured on a transect from the Kharkhiraa mountains at the western margin of the basin up to the lake Uvs at the centre of the basin. The transect included alpine mat, mountain steppe, dry steppe and semi desert. Climatic data was collected at 9 transect stations, in addition with characteristics of vegetation, soil and soil moisture. The data of summer 1998 was bundled and consolidated with a cluster analysis. On this basis forms of landscape condition could be evaluated in content, arranged chronologically and characterised by time performance models (stacks). The time performance models prove that forms of landscape condition marking the heat and the drought of summer 1998 can be found at every station of the transect except of the one on the summit of Khukh Uul at almost 3.000 m above sea level and another groundwater-influenced station at the bank of lake Uvs. However, extremely dry periods occur only from the centre of the basin up to the foothills, thus in the semi desert, the dry steppe and the short grass steppe. They do not occur in the mountain forest and in the alpine mat. Areas in the semi desert are most affected by drought and lack of precipitation during the summer 1998. Four fifths of the days in the measurement period are extremely droughty days. Either there is no precipitation at all or it is insufficient to fill up the soil water storage exhausted since spring-time. The relation of precipitation and potential evaporation averages out here at 1:12. A progressive desertification becomes apparent in the semi desert, particularly determined by an inappropriate land use in conjunction with an increasing goat-rearing in the area around the settlements. Partially this trend even affects the dry steppe in adjacency to the semi desert toward the margin of the basin. These areas are characterised not only by the highest stocking rate but also by the largest number of unofficial dirt roads thus leading to the denudation of the soil cover and finally to the spreading of desertification processes. From the methodical point of view it is obvious that the characterisation by time performance models facilitates the determination of weather and climate influence on landscape condition by summarising their information. However, the interpretation of the results has to be accomplished by a describing analysis of the measured data. The procedure applied in the western Uvs Nuur Basin and its adjacent mountains provides the opportunity to examine and substantiate the reports on global warming at regional or local level. KW - Mongolei; Uvs-Nuur-Becken KW - Witterung KW - Klima KW - Landschaftshaushalt KW - Energie- KW - Wasser- und Stoffhaushalt KW - multivariate Statistik KW - Clusteranalyse KW - landsch KW - Mongolia KW - Uvs Nuur Basin KW - weather KW - climate KW - landscape balance KW - energy balance KW - water balance KW - material balance KW - multivariate statistics KW - cluster analy Y1 - 2003 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-0001184 ER -