TY - THES A1 - Loster, Michael T1 - Knowledge base construction with machine learning methods T1 - Aufbau von Wissensbasen mit Methoden des maschinellen Lernens N2 - Modern knowledge bases contain and organize knowledge from many different topic areas. Apart from specific entity information, they also store information about their relationships amongst each other. Combining this information results in a knowledge graph that can be particularly helpful in cases where relationships are of central importance. Among other applications, modern risk assessment in the financial sector can benefit from the inherent network structure of such knowledge graphs by assessing the consequences and risks of certain events, such as corporate insolvencies or fraudulent behavior, based on the underlying network structure. As public knowledge bases often do not contain the necessary information for the analysis of such scenarios, the need arises to create and maintain dedicated domain-specific knowledge bases. This thesis investigates the process of creating domain-specific knowledge bases from structured and unstructured data sources. In particular, it addresses the topics of named entity recognition (NER), duplicate detection, and knowledge validation, which represent essential steps in the construction of knowledge bases. As such, we present a novel method for duplicate detection based on a Siamese neural network that is able to learn a dataset-specific similarity measure which is used to identify duplicates. Using the specialized network architecture, we design and implement a knowledge transfer between two deduplication networks, which leads to significant performance improvements and a reduction of required training data. Furthermore, we propose a named entity recognition approach that is able to identify company names by integrating external knowledge in the form of dictionaries into the training process of a conditional random field classifier. In this context, we study the effects of different dictionaries on the performance of the NER classifier. We show that both the inclusion of domain knowledge as well as the generation and use of alias names results in significant performance improvements. For the validation of knowledge represented in a knowledge base, we introduce Colt, a framework for knowledge validation based on the interactive quality assessment of logical rules. In its most expressive implementation, we combine Gaussian processes with neural networks to create Colt-GP, an interactive algorithm for learning rule models. Unlike other approaches, Colt-GP uses knowledge graph embeddings and user feedback to cope with data quality issues of knowledge bases. The learned rule model can be used to conditionally apply a rule and assess its quality. Finally, we present CurEx, a prototypical system for building domain-specific knowledge bases from structured and unstructured data sources. Its modular design is based on scalable technologies, which, in addition to processing large datasets, ensures that the modules can be easily exchanged or extended. CurEx offers multiple user interfaces, each tailored to the individual needs of a specific user group and is fully compatible with the Colt framework, which can be used as part of the system. We conduct a wide range of experiments with different datasets to determine the strengths and weaknesses of the proposed methods. To ensure the validity of our results, we compare the proposed methods with competing approaches. N2 - Moderne Wissensbasen enthalten und organisieren das Wissen vieler unterschiedlicher Themengebiete. So speichern sie neben bestimmten Entitätsinformationen auch Informationen über deren Beziehungen untereinander. Kombiniert man diese Informationen, ergibt sich ein Wissensgraph, der besonders in Anwendungsfällen hilfreich sein kann, in denen Entitätsbeziehungen von zentraler Bedeutung sind. Neben anderen Anwendungen, kann die moderne Risikobewertung im Finanzsektor von der inhärenten Netzwerkstruktur solcher Wissensgraphen profitieren, indem Folgen und Risiken bestimmter Ereignisse, wie z.B. Unternehmensinsolvenzen oder betrügerisches Verhalten, auf Grundlage des zugrundeliegenden Netzwerks bewertet werden. Da öffentliche Wissensbasen oft nicht die notwendigen Informationen zur Analyse solcher Szenarien enthalten, entsteht die Notwendigkeit, spezielle domänenspezifische Wissensbasen zu erstellen und zu pflegen. Diese Arbeit untersucht den Erstellungsprozess von domänenspezifischen Wissensdatenbanken aus strukturierten und unstrukturierten Datenquellen. Im speziellen befasst sie sich mit den Bereichen Named Entity Recognition (NER), Duplikaterkennung sowie Wissensvalidierung, die wesentliche Prozessschritte beim Aufbau von Wissensbasen darstellen. Wir stellen eine neuartige Methode zur Duplikaterkennung vor, die auf Siamesischen Neuronalen Netzwerken basiert und in der Lage ist, ein datensatz-spezifisches Ähnlichkeitsmaß zu erlernen, welches wir zur Identifikation von Duplikaten verwenden. Unter Verwendung einer speziellen Netzwerkarchitektur entwerfen und setzen wir einen Wissenstransfer zwischen Deduplizierungsnetzwerken um, der zu erheblichen Leistungsverbesserungen und einer Reduktion der benötigten Trainingsdaten führt. Weiterhin schlagen wir einen Ansatz zur Erkennung benannter Entitäten (Named Entity Recognition (NER)) vor, der in der Lage ist, Firmennamen zu identifizieren, indem externes Wissen in Form von Wörterbüchern in den Trainingsprozess eines Conditional Random Field Klassifizierers integriert wird. In diesem Zusammenhang untersuchen wir die Auswirkungen verschiedener Wörterbücher auf die Leistungsfähigkeit des NER-Klassifikators und zeigen, dass sowohl die Einbeziehung von Domänenwissen als auch die Generierung und Verwendung von Alias-Namen zu einer signifikanten Leistungssteigerung führt. Zur Validierung der in einer Wissensbasis enthaltenen Fakten stellen wir mit COLT ein Framework zur Wissensvalidierung vor, dass auf der interaktiven Qualitätsbewertung von logischen Regeln basiert. In seiner ausdrucksstärksten Implementierung kombinieren wir Gauß'sche Prozesse mit neuronalen Netzen, um so COLT-GP, einen interaktiven Algorithmus zum Erlernen von Regelmodellen, zu erzeugen. Im Gegensatz zu anderen Ansätzen verwendet COLT-GP Knowledge Graph Embeddings und Nutzer-Feedback, um Datenqualitätsprobleme des zugrunde liegenden Wissensgraphen zu behandeln. Das von COLT-GP erlernte Regelmodell kann sowohl zur bedingten Anwendung einer Regel als auch zur Bewertung ihrer Qualität verwendet werden. Schließlich stellen wir mit CurEx, ein prototypisches System zum Aufbau domänenspezifischer Wissensbasen aus strukturierten und unstrukturierten Datenquellen, vor. Sein modularer Aufbau basiert auf skalierbaren Technologien, die neben der Verarbeitung großer Datenmengen auch die einfache Austausch- und Erweiterbarkeit einzelner Module gewährleisten. CurEx bietet mehrere Benutzeroberflächen, die jeweils auf die individuellen Bedürfnisse bestimmter Benutzergruppen zugeschnitten sind. Darüber hinaus ist es vollständig kompatibel zum COLT-Framework, was als Teil des Systems verwendet werden kann. Wir führen eine Vielzahl von Experimenten mit unterschiedlichen Datensätzen durch, um die Stärken und Schwächen der vorgeschlagenen Methoden zu ermitteln. Zudem vergleichen wir die vorgeschlagenen Methoden mit konkurrierenden Ansätzen, um die Validität unserer Ergebnisse sicherzustellen. KW - machine learning KW - deep kernel learning KW - knowledge base construction KW - knowledge base KW - knowledge graph KW - deduplication KW - siamese neural networks KW - duplicate detection KW - entity resolution KW - transfer learning KW - knowledge transfer KW - entity linking KW - knowledge validation KW - logic rules KW - named entity recognition KW - curex KW - Curex KW - Deduplikation KW - Deep Kernel Learning KW - Duplikaterkennung KW - Entitätsverknüpfung KW - Entitätsauflösung KW - Wissensbasis KW - Konstruktion von Wissensbasen KW - Wissensgraph KW - Wissenstransfer KW - Wissensvalidierung KW - logische Regeln KW - maschinelles Lernen KW - named entity recognition KW - Siamesische Neuronale Netzwerke KW - Transferlernen Y1 - 2021 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-501459 ER - TY - RPRT A1 - Huber, Bettina A1 - Miechielsen, Milena A1 - Otto, Antje A1 - Schmidt, Katja A1 - Ullrich, Susann A1 - Deppermann, Lara-Helene A1 - Eckersley, Peter A1 - Haupt, Wolfgang A1 - Heidenreich, Anna A1 - Kern, Kristine A1 - Lipp, Torsten A1 - Neumann, Nina A1 - Schneider, Philipp A1 - Sterzel, Till A1 - Thieken, Annegret T1 - Instrumente und Maßnahmen der kommunalen Klimaanpassung T1 - Instruments and measures of municipal climate adaptation BT - Empirische Befunde für einen erfolgreichen Transfer BT - Empirical findings for a successful transfer N2 - Städte sind aufgrund ihrer Agglomeration von Bevölkerung, Sachwerten und Infrastrukturen in besonderem Maße von extremen Wetterereignissen wie Starkregen und Hitze betroffen. Zahlreiche Überflutungsereignisse infolge von Starkregen traten in den letzten Jahren in verschiedenen Regionen Deutschlands auf und führten nicht nur zu Schäden in zwei- bis dreistelliger Millionenhöhe, sondern auch zu Todesopfern. Und auch Hitzewellen, wie sie in den vergangenen Jahren vermehrt aufgetreten sind, bergen gesundheitliche Risiken, welche sich auch in verschiedenen Schätzungen zu Hitzetodesfällen wiederfinden. Um diesen Risiken zu begegnen und Schäden infolge von Wetterextremen zu reduzieren, entwickeln viele Kommunen bereits Strategien und Konzepte im Kontext der Klimaanpassung und/oder setzen Anpassungsmaßnahmen um. Neben der Entwicklung und Umsetzung eigener Ideen orientieren sich Städte dabei u. a. an Leitfäden und Beispielen aus der Literatur, Erfahrungen aus anderen Städten oder an Ergebnissen aus Forschungsprojekten. Dieser Lern- und Transferprozess, der eine Übertragung von Maßnahmen oder Instrumenten der Klimaanpassung von einem Ort auf einen anderen beinhaltet, ist bislang noch unzureichend erforscht und verstanden. Der vorliegende Bericht untersucht deshalb ebendiesen Lern- und Transferprozess zwischen sowie innerhalb von Städten sowie das Transferpotenzial konkreter Wissenstransfer-Medien, Instrumente und Maßnahmen. Damit wird das Ziel verfolgt, ein besseres Verständnis dieser Prozesse zu entwickeln und einen Beitrag zur Verbesserung des Transfers von kommunalen Klimaanpassungsaktivitäten zu leisten. Der vorliegende Inhalt baut dabei auf einer vorangegangenen Analyse des Forschungsstands zum Transfer von Policies durch Haupt et al. (2021) auf und versucht, den bereits generierten Wissensstand auf der Ebene von Policies nun um die Ebene konkreter Instrumente und Maßnahmen zu ergänzen sowie durch empirische Befunde zu ausgewählten Maßnahmen zu untermauern. Die Wissens- und Datengrundlage dieses Berichts umfasst einen Mix aus verschiedenen (Online)-Befragungen und Interviews mit Vertreter:innen relevanter Akteursgruppen, vor allem Vertreter:innen von Stadtverwaltungen, sowie den Erfahrungswerten der drei ExTrass-Fallstudienstädte Potsdam, Remscheid und Würzburg. Nach einer Einleitung beschäftigt sich Kapitel 2 mit übergeordneten Faktoren der Übertragbarkeit bzw. des Transfers. Kapitel 2.1 bietet hierbei eine Zusammenfassung zum aktuellen Wissensstand hinsichtlich des Transfers von Policies im Bereich der städtischen Klimapolitik gemäß Haupt et al. (2021). Hier werden zentrale Kriterien für einen erfolgreichen Transfer herausgearbeitet, um einen Anknüpfungspunkt für die folgenden Inhalte und empirischen Befunde auf der Ebene konkreter Instrumente und Maßnahmen zu bieten. Kapitel 2.2 schließt hieran an und präsentiert Erkenntnisse aus einer weitreichenden Kommunalbefragung. Hierbei wurde untersucht ob und welche Klimaanpassungsmaßnahmen in den Städten bereits umgesetzt werden, welche fördernden und hemmenden Aspekte es dabei gibt und welche Erfahrungen beim Transfer von Wissen und Ideen bereits vorliegen. Kapitel 3 untersucht die Rolle verschiedener Medien des Wissenstransfers und widmet sich dabei beispielhaft Leitfäden zur Klimaanpassung und Maßnahmensteckbriefen. Kapitel 3.1 beantwortet dabei Fragen nach der Relevanz und Zugänglichkeit von Leitfäden, deren Stärken und Schwächen, sowie konkreten Anforderungen vonseiten befragter Personen. Außerdem werden acht ausgewählte Leitfäden vorgestellt und komprimiert auf ihre Transferpotenziale hin eingeschätzt. Kapitel 3.2 betrachtet Maßnahmensteckbriefe als Medien des Wissenstransfers und arbeitet zentrale Aspekte für einen praxisrelevanten inhaltlichen Aufbau heraus, um basierend darauf einen Muster-Maßnahmensteckbrief für Klimaanpassungsmaßnahmen zu entwickeln und vorzuschlagen. Kapitel 4 beschäftigt sich mit sehr konkreten kommunalen Erfahrungen rund um den Transfer von sieben ausgewählten Instrumenten und Maßnahmen und bietet zahlreiche empirische Befunde aus den Kommunen, basierend auf der Kommunalbefragung, verschiedenen Interviews und den Erfahrungen aus der Projektarbeit. Die folgenden sieben Instrumente und Maßnahmen wurden ausgewählt, um eine große Breite städtischer Klimaanpassungsaktivitäten zu betrachten: 1) Klimafunktionskarten (Stadtklimakarten), 2) Starkregengefahrenkarten, 3) Checklisten zur Klimaanpassung in der Bauleitplanung, 4) Verbot von Schottergärten in Bebauungsplänen, 5) Fassadenbegrünungen, 6) klimaangepasste Gestaltung von Grün- und Freiflächen sowie 7) Handlungsempfehlungen für Betreuungseinrichtungen zum Umgang mit Hitze und Starkregen. Für jede dieser Klimaanpassungsaktivitäten wird auf Ebene der Kommunen Ziel, Verbreitung und Erscheinungsformen, Umsetzung anhand konkreter Beispiele, fördernde und hemmende Faktoren sowievorliegende Erfahrungen zu und Hinweisen auf Transfer dargestellt. Kapitel 5 schließt den vorliegenden Bericht ab, indem zentrale Transfer-Barrieren aus den gewonnenen Erkenntnissen aufgegriffen und entsprechende Empfehlungen an verschiedene Ebenen der Politik ausgesprochen werden. Diese Empfehlungen zur Verbesserung des Transfers von klimaanpassungsrelevanten Instrumenten, Strategien und Maßnahmen umfassen 1) die Verbesserung des Austauschs zwischen verschiedenen Städten, 2) die Verbesserung der Zugänglichkeit von Wissen und Erfahrungen, 3) die Schaffung von Vernetzungsstrukturen innerhalb von Städten sowie 4) bestehende Wissenslücken zu schließen. Die Autor:innen des vorliegenden Berichts hoffen, durch die vielfältigen Untersuchungsaspekte einen Beitrag zum besseren Verständnis der Lern- und Transferprozesse und zur Verbesserung des Transfers kommunaler Klimaanpassungsaktivitäten zu leisten. N2 - Due to their agglomeration of population, material assets and infrastructures, cities are particularly affected by extreme weather events such as heavy rain and heat. Numerous flooding events as a result of heavy rainfall occurred in various regions of Germany in the last years, not only resulted in losses in the double- to triple-digit million range, but also in fatalities. And heat waves which became more frequent in recent years pose health risks, including numerous cases of death. To counter these risks and to reduce damage resulting from weather extremes, many cities are already developing strategies and concepts in the context of climate adaptation and/or implement measures. In addition to developing and implementing their own ideas, cities are guided by guidelines and examples from literature, experiences from other cities, or results from research projects, among other things. This learning and transfer process, which involves the transfer of climate adaptation measures or instruments from one place to another, has not yet been sufficiently researched and understood. This report therefore examines this learning and transfer process between and within cities as well as the transfer potential of specific knowledge transfer media, instruments and measures. The aim is to develop a better understanding of these processes and to contribute to improving the transfer of municipal climate adaptation activities. This content builds on a previous analysis of the state of research on policy transfer by Haupt et al. (2021) and attempts to complement the already generated state of knowledge on the level of policies with the level of concrete instruments and measures and to substantiate it with empirical findings. The knowledge and data basis of this report comprises a mix of various (online) surveys and interviews with representatives of relevant stakeholder groups, especially representatives of city administrations, as well as the experiences of the three case study cities within the ExTrass-project, namely Potsdam, Remscheid and Würzburg. After an introduction, chapter 2 deals with overarching factors of transferability. Chapter 2.1 provides a summary of the current state of knowledge regarding the transfer of policies in the field of urban climate policy according to Haupt et al. (2021). Here, central criteria for a successful transfer are elaborated in order to provide a starting point for the following contents and empirical findings on the level of concrete instruments and measures. Chapter 2.2 follows on from this and presents findings from a wide-ranging municipal survey. Here, it was investigated whether and which climate adaptation measures are already implemented in the cities, which supporting and inhibiting aspects are present in this context, and which experiences regarding the transfer of knowledge and ideas already exist. Chapter 3 examines the role of different knowledge transfer media, focusing on guidelines on climate adaptation and fact sheets for adaptation measures as examples. Chapter 3.1 answers questions about the relevance and accessibility of guidelines, their strengths and weaknesses, as well as concrete requirements articulated by interviewees. In addition, eight selected guidelines are shortly presented and assessed in terms of their transfer potential. Chapter 3.2 looks at fact sheets for adaptation measures and elaborates central aspects for a practicable content structure and ultimately results in a proposed template fact sheet for climate adaptation measure. Chapter 4 deals with very concrete municipal experiences regarding the transfer of seven selected instruments and measures and offers numerous empirical findings from municipalities, based on the municipal survey, various interviews and the experiences drawn from the project work. The following seven tools and measures were selected to look at a broad range of urban climate adaptation activities: 1) climate function maps (urban climate maps), 2) heavy rainfall hazard maps, 3) climate adaptation checklists in urban land use planning, 4) prohibition of gravel gardens in development plans, 5) facade greening, 6) climate-adapted design of green and open spaces, and 7) recommendations for care facilities to deal with heat and heavy rain. For each of these instruments or measures at the municipality level the purpose or goal, its dissemination and manifestations, its implementation through practical examples, its supporting and inhibiting factors as well as existing experiences with and evidence of transfer are presented. Chapter 5 concludes this report by addressing key transfer barriers and making formulating recommendations for different political levels. These recommendations for improving the transfer of climate adaptation-related instruments, strategies and measures include: 1) improving the exchange between different cities, 2) improving the accessibility of knowledge and experience, 3) creating networking structures within cities and 4) closing existing knowledge gaps. The authors of this report hope to contribute to a better understanding of the learning and transfer processes and to the improvement of the transfer of municipal climate adaptation activities through the manifold aspects of this study. KW - Klimaanpassung KW - Übertragbarkeit KW - Anpassungsmaßnahmen KW - Wissenstransfer KW - Climate adaptation KW - Transferablity KW - adapatation measures KW - knowledge transfer KW - Modellstadt KW - model city KW - Pilotmaßnahmen KW - pilot measures Y1 - 2022 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:kobv:517-opus4-563456 ER -