TY - THES A1 - Koumarelas, Ioannis T1 - Data preparation and domain-agnostic duplicate detection N2 - Successfully completing any data science project demands careful consideration across its whole process. Although the focus is often put on later phases of the process, in practice, experts spend more time in earlier phases, preparing data, to make them consistent with the systems' requirements or to improve their models' accuracies. Duplicate detection is typically applied during the data cleaning phase, which is dedicated to removing data inconsistencies and improving the overall quality and usability of data. While data cleaning involves a plethora of approaches to perform specific operations, such as schema alignment and data normalization, the task of detecting and removing duplicate records is particularly challenging. Duplicates arise when multiple records representing the same entities exist in a database. Due to numerous reasons, spanning from simple typographical errors to different schemas and formats of integrated databases. Keeping a database free of duplicates is crucial for most use-cases, as their existence causes false negatives and false positives when matching queries against it. These two data quality issues have negative implications for tasks, such as hotel booking, where users may erroneously select a wrong hotel, or parcel delivery, where a parcel can get delivered to the wrong address. Identifying the variety of possible data issues to eliminate duplicates demands sophisticated approaches. While research in duplicate detection is well-established and covers different aspects of both efficiency and effectiveness, our work in this thesis focuses on the latter. We propose novel approaches to improve data quality before duplicate detection takes place and apply the latter in datasets even when prior labeling is not available. Our experiments show that improving data quality upfront can increase duplicate classification results by up to 19%. To this end, we propose two novel pipelines that select and apply generic as well as address-specific data preparation steps with the purpose of maximizing the success of duplicate detection. Generic data preparation, such as the removal of special characters, can be applied to any relation with alphanumeric attributes. When applied, data preparation steps are selected only for attributes where there are positive effects on pair similarities, which indirectly affect classification, or on classification directly. Our work on addresses is twofold; first, we consider more domain-specific approaches to improve the quality of values, and, second, we experiment with known and modified versions of similarity measures to select the most appropriate per address attribute, e.g., city or country. To facilitate duplicate detection in applications where gold standard annotations are not available and obtaining them is not possible or too expensive, we propose MDedup. MDedup is a novel, rule-based, and fully automatic duplicate detection approach that is based on matching dependencies. These dependencies can be used to detect duplicates and can be discovered using state-of-the-art algorithms efficiently and without any prior labeling. MDedup uses two pipelines to first train on datasets with known labels, learning to identify useful matching dependencies, and then be applied on unseen datasets, regardless of any existing gold standard. Finally, our work is accompanied by open source code to enable repeatability of our research results and application of our approaches to other datasets. N2 - Die erfolgreiche Durchführung eines datenwissenschaftlichen Projekts erfordert eine Reihe sorgfältiger Abwägungen, die während des gesamten Prozessesverlaufs zu treffen sind. Obwohl sich der Schwerpunkt oft auf spätere Prozessphasen konzentriert, verbringen Experten in der Praxis jedoch einen Großteil ihrer Zeit in frühen Projektphasen in denen sie Daten aufbereiten, um sie mit den Anforderungen vorhandener Systeme in Einklang zu bringen oder die Genauigkeit ihrer Modelle zu verbessern. Die Duplikaterkennung wird üblicherweise während der Datenbereinigungsphase durchgeführt, sie dient der Beseitigung von Dateninkonsistenzen und somit der Verbesserung von Gesamtqualität und Benutzerfreundlichkeit der Daten. Während die Datenbereinigung eine Vielzahl von Ansätzen zur Durchführung spezifischer Operationen wie etwa dem Schema-Abgleich und der Datennormalisierung umfasst, stellt die Identifizierung und Entfernung doppelter Datensätze eine besondere Herausforderung dar. Dabei entstehen Duplikate, wenn mehrere Datensätze, welche die gleichen Entitäten repräsentieren, in einer Datenbank vorhanden sind. Die Gründe dafür sind vielfältig und reichen von einfachen Schreibfehlern bis hin zu unterschiedlichen Schemata und Formaten integrierter Datenbanken. Eine Datenbank duplikatfrei zu halten, ist für die meisten Anwendungsfälle von entscheidender Bedeutung, da ihre Existenz zu falschen Negativ- und Falsch-Positiv-Abfragen führt. So können sich derartige Datenqualitätsprobleme negativ auf Aufgaben wie beispielsweise Hotelbuchungen oder Paketzustellungen auswirken, was letztlich dazu führen kann, dass Benutzer ein falsches Hotel buchen, oder Pakete an eine falsche Adresse geliefert werden. Um ein breites Spektrum potenzieller Datenprobleme zu identifizieren, deren Lösung die Beseitigung von Duplikaten erleichtert, sind eine Reihe ausgefeilter Ansätze erforderlich. Obgleich der Forschungsbereich der Duplikaterkennung mit der Untersuchung verschiedenster Effizienz und Effektivitätsaspekte bereits gut etabliert ist, konzentriert sich diese Arbeit auf letztgenannte Aspekte. Wir schlagen neue Ansätze zur Verbesserung der Datenqualität vor, die vor der Duplikaterkennung erfolgen, und wenden letztere auf Datensätze an, selbst wenn diese über keine im Vorfeld erstellten Annotationen verfügen. Unsere Experimente zeigen, dass durch eine im Vorfeld verbesserte Datenqualität die Ergebnisse der sich anschließenden Duplikatklassifizierung um bis zu 19% verbessert werden können. Zu diesem Zweck schlagen wir zwei neuartige Pipelines vor, die sowohl generische als auch adressspezifische Datenaufbereitungsschritte auswählen und anwenden, um den Erfolg der Duplikaterkennung zu maximieren. Die generische Datenaufbereitung, wie z.B. die Entfernung von Sonderzeichen, kann auf jede Relation mit alphanumerischen Attributen angewendet werden. Bei entsprechender Anwendung werden Datenaufbereitungsschritte nur für Attribute ausgewählt, bei denen sich positive Auswirkungen auf Paarähnlichkeiten ergeben, welche sich direkt oder indirekt auf die Klassifizierung auswirken. Unsere Arbeit an Adressen umfasst zwei Aspekte: erstens betrachten wir mehr domänenspezifische Ansätze zur Verbesserung der Adressqualität, zweitens experimentieren wir mit bekannten und modifizierten Versionen verschiedener Ähnlichkeitsmaße, um infolgedessen das am besten geeignete Ähnlichkeitsmaß für jedes Adressattribut, z.B. Stadt oder Land, zu bestimmen. Um die Erkennung von Duplikaten bei Anwendungen zu erleichtern, in denen Goldstandard-Annotationen nicht zur Verfügung stehen und deren Beschaffung aus Kostengründen nicht möglich ist, schlagen wir MDedup vor. MDedup ist ein neuartiger, regelbasierter und vollautomatischer Ansatz zur Dublikaterkennung, der auf Matching Dependencies beruht. Diese Abhängigkeiten können zur Erkennung von Duplikaten genutzt und mit Hilfe modernster Algorithmen effizient ohne vorhergehenden Annotationsaufwand entdeckt werden. MDedup verwendet zwei Pipelines, um zunächst auf annotierten Datensätzen zu trainieren, wobei die Identifizierung nützlicher Matching-Abhängigkeiten erlernt wird, welche dann unabhängig von einem bestehenden Goldstandard auf ungesehenen Datensätzen angewendet werden können. Schließlich stellen wir den im Rahmen dieser Arbeit entstehenden Quellcode zur Verfügung, wodurch sowohl die Wiederholbarkeit unserer Forschungsergebnisse als auch die Anwendung unserer Ansätze auf anderen Datensätzen gewährleistet werden soll. T2 - Datenaufbereitung und domänenagnostische Duplikaterkennung KW - duplicate detection KW - data cleaning KW - entity resolution KW - record linkage KW - data preparation KW - data matching KW - address normalization KW - machine learning KW - matching dependencies KW - Adressnormalisierung KW - Datenbereinigung KW - Datenabgleich KW - Datenaufbereitung KW - Duplikaterkennung KW - Entitätsauflösung KW - Maschinelles Lernen KW - Abgleich von Abhängigkeiten KW - Datensatzverknüpfung Y1 - 2020 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-489131 ER - TY - THES A1 - Eggers, Nele T1 - Properties of Arctic aerosol in the transition between Arctic haze to summer season derived by lidar N2 - During the Arctic haze period, the Arctic troposphere consists of larger, yet fewer, aerosol particles than during the summer (Tunved et al., 2013; Quinn et al., 2007). Interannual variability (Graßl and Ritter, 2019; Rinke et al., 2004), as well as unknown origins (Stock et al., 2014) and properties of aerosol complicate modeling these annual aerosol cycles. This thesis investigates the modification of the microphysical properties of Arctic aerosols in the transition from Arctic haze to the summer season. Therefore, lidar measurements of Ny-Ålesund from April 2021 to the end of July 2021 are evaluated based on the aerosols’ optical properties. An overview of those properties will be provided. Furthermore, parallel radiosonde data is considered for indication of hygroscopic growth. The annual aerosol cycle in 2021 differs from expectations based on previous studies from Tunved et al. (2013) and Quinn et al. (2007). Developments of backscatter, extinction, aerosol depolarisation, lidar ratio and color ratio show a return of the Arctic haze in May. The haze had already reduced in April, but regrew afterwards. The average Arctic aerosol displays hygroscopic behaviour, meaning growth due to water uptake. To determine such a behaviour is generally laborious because various meteorological circumstances need to be considered. Two case studies provide further information on these possible events. In particular, a day with a rare ice cloud and with highly variable water cloud layers is observed. N2 - Während der Arctic haze Periode sind größere, jedoch auch weniger, Aerosole in der arktischen Troposphäre vorhanden als im Sommer (Tunved et al., 2013; Quinn et al., 2007). Interannuale Variabilität (Graßl and Ritter, 2019; Rinke et al., 2004), sowie unbekannte Herkunft (Stock et al., 2014) und Eigenschaften der Aerosole erschweren die Modellierung der Aerosol-Jahresgänge. Diese Arbeit untersucht, wie sich die mikrophysikalischen Eigenschaften der Aerosole beim Übergang vom Arctic haze zur Sommerzeit ändern. Dafür werden Lidar Messungen aus Ny-Ålesund von April 2021 bis Ende Juli 2021 hinsichtlich der optischen Eigenschaften der Aerosole untersucht. Ein Überblick über diese Eigenschaften wird gegeben. Zusätzlich werden parallele Radiosondendaten mit einbezogen, um Hinweise auf hygroskopisches Wachstum zu erhalten. Der Jahresgang der Aerosole in 2021 unterscheidet sich von Erwartungen, gebildet aus früheren Studien von Tunved et al. (2013) und Quinn et al. (2007). Die zeitliche Entwicklung des Rückstreuungskoeffizienten, Extinktionskoeffizienten, der Aerosol Depolarisation, des Lidarverhältnisses und des Farbverhältnisses zeigen, dass der Arctic haze im Mai zurückkehrt. Im April hatte der haze bereits abgenommen, stieg in Mai jedoch wieder an. In der Arktis zeigt ein Aerosol typischerweise hygroskopisches Verhalten - mit anderen Worten, es wächst durch Aufnahme von Wasser. Ein solches alleine aus Fernerkundungsdaten zu bestimmen ist jedoch in der Regel aufwendig, weil unterschiedliche meteorologische Bedingungen zu berücksichtigen sind. Zwei Fallstudien geben mehr Informationen über die möglichen hygroskopischen Verhaltensweisen der Aerosole. Insbesondere wird auch ein Tag mit einer Eiswolke und stark fluktuierenden Wasserwolken beobachtet. KW - remote sensing KW - Lidar KW - Arctic aerosol KW - aerosol: optical properties KW - aerosol: hygroscopic growth KW - Arctic haze KW - arktischer Dunst KW - aerosol: hygroskopisches Wachstum KW - aerosol: optische Eigenschaften KW - arktisches Aerosol KW - Fernerkundung KW - Lidar Y1 - 2023 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-619438 ER - TY - THES A1 - Nakoudi, Konstantina T1 - Properties and radiative effect of aerosol and cirrus clouds over the European Arctic T1 - Eigenschaften und Strahlungseffekt von Aerosol und Zirruswolken über der europäischen Arktis N2 - Over the last decades, the rate of near-surface warming in the Arctic is at least double than elsewhere on our planet (Arctic amplification). However, the relative contribution of different feedback processes to Arctic amplification is a topic of ongoing research, including the role of aerosol and clouds. Lidar systems are well-suited for the investigation of aerosol and optically-thin clouds as they provide vertically-resolved information on fine temporal scales. Global aerosol models fail to converge on the sign of the Arctic aerosol radiative effect (ARE). In the first part of this work, the optical and microphysical properties of Arctic aerosol were characterized at case study level in order to assess the short-wave (SW) ARE. A long-range transport episode was first investigated. Geometrically similar aerosol layers were captured over three locations. Although the aerosol size distribution was different between Fram Strait(bi-modal) and Ny-Ålesund (fine mono-modal), the atmospheric column ARE was similar. The latter was related to the domination of accumulation mode aerosol. Over both locations top of the atmosphere (TOA) warming was accompanied by surface cooling. Subsequently, the sensitivity of ARE was investigated with respect to different aerosol and spring-time ambient conditions. A 10% change in the single-scattering albedo (SSA) induced higher ARE perturbations compared to a 30% change in the aerosol extinction coefficient. With respect to ambient conditions, the ARETOA was more sensitive to solar elevation changes compared to AREsur f ace. Over dark surfaces the ARE profile was exclusively negative, while over bright surfaces a negative to positive shift occurred above the aerosol layers. Consequently, the sign of ARE can be highly sensitive in spring since this season is characterized by transitional surface albedo conditions. As the inversion of the aerosol microphysics is an ill-posed problem, the inferred aerosol size distribution of a low-tropospheric event was compared to the in-situ measured distribution. Both techniques revealed a bi-modal distribution, with good agreement in the total volume concentration. However, in terms of SSA a disagreement was found, with the lidar inversion indicating highly scattering particles and the in-situ measurements pointing to absorbing particles. The discrepancies could stem from assumptions in the inversion (e.g. wavelength-independent refractive index) and errors in the conversion of the in-situ measured light attenuation into absorption. Another source of discrepancy might be related to an incomplete capture of fine particles in the in-situ sensors. The disagreement in the most critical parameter for the Arctic ARE necessitates further exploration in the frame of aerosol closure experiments. Care must be taken in ARE modelling studies, which may use either the in-situ or lidar-derived SSA as input. Reliable characterization of cirrus geometrical and optical properties is necessary for improving their radiative estimates. In this respect, the detection of sub-visible cirrus is of special importance. The total cloud radiative effect (CRE) can be negatively biased, should only the optically-thin and opaque cirrus contributions are considered. To this end, a cirrus retrieval scheme was developed aiming at increased sensitivity to thin clouds. The cirrus detection was based on the wavelet covariance transform (WCT) method, extended by dynamic thresholds. The dynamic WCT exhibited high sensitivity to faint and thin cirrus layers (less than 200 m) that were partly or completely undetected by the existing static method. The optical characterization scheme extended the Klett–Fernald retrieval by an iterative lidar ratio (LR) determination (constrained Klett). The iterative process was constrained by a reference value, which indicated the aerosol concentration beneath the cirrus cloud. Contrary to existing approaches, the aerosol-free assumption was not adopted, but the aerosol conditions were approximated by an initial guess. The inherent uncertainties of the constrained Klett were higher for optically-thinner cirrus, but an overall good agreement was found with two established retrievals. Additionally, existing approaches, which rely on aerosol-free assumptions, presented increased accuracy when the proposed reference value was adopted. The constrained Klett retrieved reliably the optical properties in all cirrus regimes, including upper sub-visible cirrus with COD down to 0.02. Cirrus is the only cloud type capable of inducing TOA cooling or heating at daytime. Over the Arctic, however, the properties and CRE of cirrus are under-explored. In the final part of this work, long-term cirrus geometrical and optical properties were investigated for the first time over an Arctic site (Ny-Ålesund). To this end, the newly developed retrieval scheme was employed. Cirrus layers over Ny-Ålesund seemed to be more absorbing in the visible spectral region compared to lower latitudes and comprise relatively more spherical ice particles. Such meridional differences could be related to discrepancies in absolute humidity and ice nucleation mechanisms. The COD tended to decline for less spherical and smaller ice particles probably due to reduced water vapor deposition on the particle surface. The cirrus optical properties presented weak dependence on ambient temperature and wind conditions. Over the 10 years of the analysis, no clear temporal trend was found and the seasonal cycle was not pronounced. However, winter cirrus appeared under colder conditions and stronger winds. Moreover, they were optically-thicker, less absorbing and consisted of relatively more spherical ice particles. A positive CREnet was primarily revealed for a broad range of representative cloud properties and ambient conditions. Only for high COD (above 10) and over tundra a negative CREnet was estimated, which did not hold true over snow/ice surfaces. Consequently, the COD in combination with the surface albedo seem to play the most critical role in determining the CRE sign over the high European Arctic. N2 - Seit den letzten Jahrzehnten erwärmt sich die arktische, oberflächennahe Luft mindestens doppelt so schnell, wie anderswo auf unserem Planeten (arktische Verstärkung). Der relative Beitrag verschiedener Rückkopplungsprozesse zu dieser arktischen Verstärkung ist ein Thema laufender Forschung, einschließlich der Rolle von Aerosol und Wolken. Lidarsysteme eignen sich gut zur Untersuchung von Aerosolen und optisch dünnen Wolken, da sie vertikal aufgelöste Informationen auf kurzen Zeitskalen liefern. Globale Aerosolmodelle können das Vorzeichen des Aerosolstrahlungseffekts (ARE) in der Arktis nicht erfassen. Im ersten Teil dieser Arbeit, wurden die optischen und mikrophysikalischen Eigenschaften des arktischen Aerosols auf Fallstudienebene charakterisiert, um das kurzwellige ARE zu bestimmen. Ein Ferntransportereignis von Aerosol wurde zuerst untersucht. An drei Standorten wurden geometrisch ähnliche Aerosolschichten erfasst. Obwohl die Aerosolgrößenverteilung zwischen der Framstraße (bimodal) und Ny-Ålesund (monomodal im Akkumulationsmode) unterschiedlich war, ergaben sich ähnliche Werte für das ARE in der atmosphärische Säule. Letzteres hängt mit der Dominanz des Akkumulationsmodus-Aerosols zusammen. Über beiden Standorten ergab sich am Oberrand der Atmosphäre (TOA) eine Erwärmung; diese wurde von einer Oberflächenkühlung begleitet. Anschließend wurde die Abhängigkeit der ARE in Bezug auf verschiedene Aerosole und Umgebungsbedingungen im Frühling untersucht. Eine Änderung der Einfachstreualbedo (SSA) um 10% induzierte höhere ARE-Änderungen im Vergleich zu einer 30%igen Änderung des Aerosol-Extinktionskoeffizienten. In Bezug auf die Umgebungsbedingungen war die TOAARE im Vergleich zur Oberflächen-ARE empfindlicher gegenüber Änderungen der Sonnenhöhe. Über dunklen Oberflächen war das ARE-Profil ausschließlich negativ, während über hellen Oberflächen oberhalb der Aerosolschichten eine Verschiebung von negativen zu positiven Werten auftrat. Entsprechend ist das Vorzeichen der ARE im Frühjahr hochempfindlich, da diese Jahreszeit durch starke Änderung der Oberflächenalbedo gekennzeichnet ist. Da die Inversion der Aerosolmikrophysik aus optischen Daten ein schlecht-gestelltes Problem ist, wurde die abgeleitete Aerosolgrößenverteilung eines Aerosol-Ereignisses in der niederen Troposphäre mit der einer aus in situ Verfahren abgeleiteten Verteilung verglichen. Beide Techniken ergaben zwei Aerosolmodi mit guter Übereinstimmung in Bezug auf die Gesamtvolumenkonzentration. In Bezug auf die SSA wurde jedoch ein Unterscied festgestellt, wobei die Lidarinversion auf stark streuende Partikel und die in-situ Messungen auf absorbierende Partikel hinwiesen. Die Abweichungen könnten auf Annahmen bei der Inversion (z.B. wellenlängenunabhängiger Brechungsindex) und auf Fehler bei der Umrechnung der in-situ gemessenen Lichtdämpfung in Absorption zurückzuführen sein. Eine weitere Ursache der Diskrepanz könnte auf eine unvollständige Erfassung von Feinpartikeln in den insitu-Sensoren zurückzuführen sein. Die Unstimmigkeit über diesen wichtigsten Parameter für die arktische ARE macht weitere Untersuchungen im Rahmen von Aerosolschließungsexperimenten erforderlich. Vorsicht ist bei der ARE-aus Modellierungsstudien geboten, bei denen entweder in-situ- oder lidar-abgeleitete SSA als Input verwendet werden. Eine zuverlässige Charakterisierung von Zirruswolken ist erforderlich, um die Abschätzung ihrer Strahlungswirkung zu verbessern. Von besonderer Bedeutung ist dabei der Nachweis von sub-visible Zirrus. Der Wolkenstrahlungseffekt (CRE) fällt zu negativ aus, wenn nur der optisch dünne und opake Zirrus berücksichtigt werden. Daher wurde ein ZirrusErkennungsschema basierend auf Lidardaten entwickelt. Das Schema verwendet die Wavelet– Kovarianz–Transformation (WCT), erweitert um dynamische Schwellenwerte. Die dynamische WCT zeigte eine hohe Empfindlichkeit gegenüber schwachen und dünnen Zirrusschichten von weniger als 200 m Mächtigkeit. Das optische Charakterisierungsschema erweiterte die Klett–Fernald–Retrieval durch iterative Lidar-Ratio (LR) Bestimmung (constrained Klett). Der iterative Prozess wurde durch einen Referenzwert eingeschränkt, der die Aerosolkonzentration unterhalb der Zirruswolke angab. Im Gegensatz zu bisherigen Ansätzen brauchte keine Aerosolfreiheit angenommen zu werden. Stattdessen wurden realistischere Annahmen unter der Wolke verwendet. Die inhärenten Unsicherheiten des eingeschränkten Kletts waren bei optisch dünneren Zirren höher, aber insgesamt wurde eine gute Übereinstimmung mit zwei etablierten Retrievals gefunden. Darüber hinaus konnten die bestehenden Ansätze, die auf aerosolfreien Annahmen beruhen, ebenfalls verbessert werden, wenn der vorgeschlagene Referenzwert verwendet wurde. Der constrained Klett konnte die optischen Eigenschaften in allen Zirrusregimen zuverlässig abrufen, einschliesslich der oberen sub-visible Zirren mit COD bis hinunter zu 0,02. Zirrus ist die einzige Wolkengattung, die tagsüber am Atmosphärenoberrand entweder eine Kühlung oder eine Erwärmung hervorrufen kann. Über der Arktis sind die Eigenschaften und das CRE von Zirrus bislang nur wenig erforscht. Im letzten Teil dieser Arbeit wurden erstmals mit dem neuentwickelten Retrieval-Schema deren langfristige geometrische und optische Eigenschaften an einem arktischen Standort untersucht. Zirruswolken über Ny-Ålesund schienen im sichtbaren Spektralbereich absorbierender zu sein als in den niedrigen Breiten und mehr kugelförmige Eispartikel zu enthalten. Solche meridididialen Unterschiede könnten mit Diskrepanzen der absoluten Luftfeuchtigkeit und der Eiskeimbildung zusammenhängen. Tendenziell sank die COD bei weniger kugelförmigen und kleineren Eispartikeln, was wahrscheinlich auf eine geringere Wasserdampfablagerung an der Partikeloberfläche zurückzuführen ist. Die optischen Eigenschaften des Zirrus zeigten eine geringe Abhängigkeit von Umgebungstemperatur und Windbedingungen. In den 10 Jahren der Analyse konnte kein eindeutiger zeitlicher Trend und kein ausgeprägter saisonaler Zyklus festgestellt werden. Ein positives netto-CRE wurde für ein breites Spektrum von repräsentative Wolkeneigenschaften und Umgebungsbedingungen festgestellt. Für hohe COD (über 10) wurde jedoch ein negatives netto-CRE über der Tundra ermittelt, im Gegensatz zu Schnee- / Eisoberflächen. Folglich scheint die COD in Verbindung mit der Oberflächenalbedo die kritischste Rolle bei der Bestimmung des CRE über der hohen europäischen Arktis zu spielen. KW - aerosol KW - clouds KW - cirrus clouds KW - European Arctic KW - lidar KW - radiative transfer modeling KW - Europäische Arktis KW - Aerosol KW - Zirruswolken KW - Wolken KW - Lidar KW - Strahlungtransportmodellierung Y1 - 2021 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-530366 ER -