020 Bibliotheks- und Informationswissenschaften
Refine
Has Fulltext
- no (20) (remove)
Year of publication
Document Type
- Article (18)
- Part of a Book (1)
- Working Paper (1)
Is part of the Bibliography
- yes (20)
Keywords
- Forschungsdaten (2)
- Open Access (2)
- Zweitveröffentlichung (2)
- duplicate detection (2)
- Affiliation (1)
- Agrarwissenschaft (1)
- Bibliometrie (1)
- Bibliotheksetat (1)
- CIO (1)
- DFG (1)
PyFin-sentiment
(2023)
Responding to the poor performance of generic automated sentiment analysis solutions on domain-specific texts, we collect a dataset of 10,000 tweets discussing the topics of finance and investing. We manually assign each tweet its market sentiment, i.e., the investor’s anticipation of a stock’s future return. Using this data, we show that all existing sentiment models trained on adjacent domains struggle with accurate market sentiment analysis due to the task’s specialized vocabulary. Consequently, we design, train, and deploy our own sentiment model. It outperforms all previous models (VADER, NTUSD-Fin, FinBERT, TwitterRoBERTa) when evaluated on Twitter posts. On posts from a different platform, our model performs on par with BERT-based large language models. We achieve this result at a fraction of the training and inference costs due to the model’s simple design. We publish the artifact as a python library to facilitate its use by future researchers and practitioners.
We used structural topic modeling to analyze over 800,000 German tweets about COVID-19 to answer the questions: What patterns emerge in tweets as a response to a health crisis? And how do topics discussed change over time? The study leans on the goals associated with the health information seeking (GAINS) model, discerning whether a post aims at tackling and eliminating the problem (i.e., problem-focused) or managing the emotions (i.e., emotion-focused); whether it strives to maximize positive outcomes (promotion focus) or to minimize negative outcomes (prevention focus). The findings indicate four clusters salient in public reactions: 1) “Understanding” (problem-promotion); 2) “Action planning” (problem-prevention); 3) “Hope” (emotion-promotion) and 4) “Reassurance” (emotion-prevention). Public communication is volatile over time, and a shift is evidenced from self-centered to community-centered topics within 4.5 weeks. Our study illustrates social media text mining's potential to quickly and efficiently extract public opinions and reactions. Monitoring fears and trending topics enable policymakers to rapidly respond to deviant behavior, like resistive attitudes toward containment measures or deteriorating physical health. Healthcare workers can use the insights to provide mental health services for battling anxiety or extensive loneliness from staying home.
Data errors represent a major issue in most application workflows. Before any important task can take place, a certain data quality has to be guaranteed by eliminating a number of different errors that may appear in data. Typically, most of these errors are fixed with data preparation methods, such as whitespace removal. However, the particular error of duplicate records, where multiple records refer to the same entity, is usually eliminated independently with specialized techniques. Our work is the first to bring these two areas together by applying data preparation operations under a systematic approach prior to performing duplicate detection. <br /> Our process workflow can be summarized as follows: It begins with the user providing as input a sample of the gold standard, the actual dataset, and optionally some constraints to domain-specific data preparations, such as address normalization. The preparation selection operates in two consecutive phases. First, to vastly reduce the search space of ineffective data preparations, decisions are made based on the improvement or worsening of pair similarities. Second, using the remaining data preparations an iterative leave-one-out classification process removes preparations one by one and determines the redundant preparations based on the achieved area under the precision-recall curve (AUC-PR). Using this workflow, we manage to improve the results of duplicate detection up to 19% in AUC-PR.
Die große Bedeutung der Informationstechnologie für die Wissenschaftsdisziplinen und die zentralen Infrastruktureinrichtungen der Hochschulen steht heutzutage außer Frage. Der Beitrag liefert einen historischen Überblick über die Einführung und Weiterentwicklung der IT in deutschen Hochschulen von den 1950er-Jahren bis heute, wobei der Fokus auf den Bibliotheken und Rechenzentren liegt. Es zeigt sich, dass die verschiedenen Phasen der Technologieentwicklung zu heterogenen IT-Organisationsstrukturen in den Hochschulen geführt haben. DFG und HRK empfehlen daher seit 20 Jahren die Klärung der Verantwortlichkeiten im Rahmen einer IT-Governance sowie die Implementierung eines CIO-Modells. Wie verschiedene Studien zeigen, ist die Umsetzung in der deutschen Hochschullandschaft bislang jedoch nur in Teilen gelungen. Die Herausforderung an vielen Hochschulen besteht nach wie vor darin, die IT-Organisation aus ihrer reaktiven Rolle zu befreien und zu einem aktiven Treiber der digitalen Transformation umzubauen.
The integration of multiple data sources is a common problem in a large variety of applications. Traditionally, handcrafted similarity measures are used to discover, merge, and integrate multiple representations of the same entity-duplicates-into a large homogeneous collection of data. Often, these similarity measures do not cope well with the heterogeneity of the underlying dataset. In addition, domain experts are needed to manually design and configure such measures, which is both time-consuming and requires extensive domain expertise. <br /> We propose a deep Siamese neural network, capable of learning a similarity measure that is tailored to the characteristics of a particular dataset. With the properties of deep learning methods, we are able to eliminate the manual feature engineering process and thus considerably reduce the effort required for model construction. In addition, we show that it is possible to transfer knowledge acquired during the deduplication of one dataset to another, and thus significantly reduce the amount of data required to train a similarity measure. We evaluated our method on multiple datasets and compare our approach to state-of-the-art deduplication methods. Our approach outperforms competitors by up to +26 percent F-measure, depending on task and dataset. In addition, we show that knowledge transfer is not only feasible, but in our experiments led to an improvement in F-measure of up to +4.7 percent.
Nicht im Trüben fischen
(2021)
Es darf gekocht werden
(2019)
Eine achtköpfige Delegation der Universität Potsdam (UP) besuchte vom 18. bis 21. November 2018 die Tel Aviv University (TAU) in Israel. Die Kooperation zwischen beiden Einrichtungen wurde durch einen »staff exchange« intensiviert. So konnten Mitarbeiter*innen der UP ihren Gegenpart an der TAU kennenlernen und sich inhaltlich austauschen. Der vorliegende Bericht basiert auf Gesprächen mit drei der insgesamt fünf Bibliotheksdirektorinnen sowie zwei weiteren Kolleginnen aus dem Bereich Erwerbung und Katalogisierung. Dabei wurden unterschiedliche Themenbereiche aus dem Bibliothekswesen und die Sicht beziehungsweise der Stand dazu an der TAU und der UP angesprochen. Der vorliegende Bericht geht auf die Themenfelder Bibliothekssystem, Open Access und Bibliothek als Raum ein.
Die Universität Potsdam verwaltet seit 2015 einen DFG-geförderten Publikationsfonds. In den Publikationsjahren 2015 und 2017 wurden Outputanalysen durchgeführt. Open Access ist seit 2018 ein zentraler Bestandteil des Mittelverteilungsmodells. Der Artikel thematisiert die zentralen Erkenntnisse der letzten fünf Jahre und illustriert die entstandene Infrastruktur. Außerdem werden aktuelle Herausforderungen und mögliche Lösungsansätze der Transformation auf dem Weg hin zu 100 Prozent Open Access thematisiert.
Die Universität Potsdam hat 2018 zum zweiten Mal erfolgreich am Times Higher Education-Ranking (THE-Ranking) teilgenommen. Hierfür wurde erneut das Publikationsaufkommen inklusive der Verbreitung der IDs von Autorinnen und Autoren, wie bspw. ORCiD, Researcher-ID oder Google Scholar-ID, ermittelt. Die aus den Erkenntnissen der ersten bibliometrischen Output-Analyse abgeleiteten Maßnahmen wurden nun hinsichtlich ihrer Wirksamkeit beurteilt. Der vorliegende Artikel vergleicht die Ergebnisse beider Analysen und thematisiert die Entwicklungen und Implikationen seit dem Ergreifen der ersten Maßnahmen.
Am Beispiel der Erd- und Umweltwissenschaften (einschließlich der landschafts- und standortbezogenen Teilgebiete der Agrarwissenschaften) zeigt dieser Beitrag, dass auch in scheinbar „unverdächtigen“ Disziplinen personenbezogene Forschungsdaten vorkommen. Eine Auswertung der Literatur zeigt, dass allgemeine Handreichungen zum Datenschutz in der Forschung kaum Unterstützung bei der Arbeit mit den für diese Disziplinen besonders relevanten Fällen bieten. Für die in den Erd- und Umweltwissenschaften besonders relevanten raumbezogenen Daten kommt hinzu, dass selbst unter Fachjuristinnen Uneinigkeit über die datenschutzrechtliche Bewertung herrscht. Die Ergebnisse einer empirischen Vorstudie zeigen eine ganze Reihe verschiedener Arten personenbezogener Forschungsdaten auf, die in der Forschungspraxis der Erd- und Umweltwissenschaften eine Rolle spielen. Sie legen außerdem nahe, dass der Umgang mit personenbezogenen Daten in der Forschungspraxis der Erd- und Umweltwissenschaften auf Grund der mangelnden Vertrautheit mit dem Datenschutz nicht immer den rechtlichen Anforderungen entspricht. Auch Unterstützung durch Fachgesellschaften und Infrastruktureinrichtungen – etwa in Form disziplinspezifischer Handreichungen, qualifizierter Beratung oder institutionalisierten Möglichkeiten, Daten sicher zu archivieren und gegebenenfalls zugangsbeschränkt zu publizieren – bestehen kaum. Aus dieser Situation ergeben sich Herausforderungen an die Weiterentwicklung der disziplinären Datenkultur und Dateninfrastruktur, beispielsweise im Rahmen des Prozesses zum Aufbau einer Nationalen Forschungsdateninfrastruktur (NFDI). Zu den Möglichkeiten für Infrastruktureinrichtungen, diese Weiterentwicklung zu unterstützen, zeigt dieser Beitrag Handlungsoptionen auf.
Mit RISE-DE liegt als FDMentor-Projektergebnis ein Referenzmodell für Strategieprozesse im institutionellen Forschungsdatenmanagement vor. RISE-DE bietet einen Bewertungsrahmen zur Selbstevaluation und Zielbestimmung und eignet sich als Werkzeug zur Gestaltung einer strukturierten, Stakeholder-orientierten Strategieentwicklung für das Forschungsdatenmanagement an Hochschulen und Forschungseinrichtungen.
RISE-DE basiert auf dem lose an Reifegradenmodellen orientierten RISE-Framework des DCC (RISE v1.1), wurde aber für den Einsatz in partizipativen Prozessen deutlich überarbeitet sowie inhaltlich an den deutschen Wissenschaftskontext und Entwicklungen in der guten Praxis im FDM angepasst. Ein mit Hilfe von RISE-DE erarbeitete Strategie erfüllt zugleich die von der Hochschulrektorenkonferenz und der League of European Research Universities formulierten Anforderungen.
Die Veränderungen im Bereich der Literaturerwerbung und -nutzung innerhalb der letzten sieben Jahre haben einen Neuentwurf des Mittelverteilungsmodells der Universitätsbibliothek Potsdam unumgänglich gemacht. Dieser gliedert sich klar in Segmente und verankert erstmals auch Open Access im Bibliotheksetat. Damit wird dem angestrebten Transformationsprozess Rechnung getragen.
Spurensuche
(2014)
Sich der Diskussion stellen
(2012)
Die Zukunftswerkstatt wollte wissen, ob Konzepte wie Liquid Democracy (http://liqd.net/) und Plattformen wie Adhocracy (http://code.adhocracy.de/) oder AVAAZ (www.avaaz.org/ de/) konkret für das Bibliothekswesen eingesetzt werden können. Die Beteiligung an der Internet-Enquete Kommission des Bundestages (https://enquetebeteiligung. de/) zeigte, dass die Nutzung im Sinne von gemeinschaftlicher Politikberatung möglich ist. Die »Stop SOPA/PIPA«- und die »Anti-ACTA«-Mobilisierungen belegen, dass Politik immer mehr auf die Bürger eingehen muss – und Social Media mitnichten tot sind. Heike Stadler beschäftigt sich intensiv mit dem Thema »Bürgerbeteiligungen für Bibliotheken« (siehe unter anderem BuB Heft 6/2011, Seite 450). Hier ihr Beitrag für die Zukunftswerkstatt
Der Bürger entscheidet mit
(2011)
»Warum erregt der geplante Abriss eines Bahnhofs die Nation, während gegen das hundertfache Sterben von Bibliotheken immer nur ein paar Stimmen laut werden? Wo sind die Wutbürger, wenn man sie braucht?«, überlegte sich hierzulande Tilman Spreckelsen.1 Die Kernfrage lautet also: Stehen die Bürger eigentlich hinter der Bibliothek? Ob und wie die Bürgerschaft für ihre Öffentliche Bibliothek entscheidet, wenn sie entscheiden darf, wird im vorliegenden Aufsatz thematisiert. Ergebnisse von Bürgerbegehren und Bürgerentscheiden stehen dabei im Fokus, da bürgerschaftliches Engagement bei diesen Mitwirkungsinstrumenten besonders gefragt ist und es gleichzeitig kommunalpolitische Folgen haben kann. Am Beispiel von Stuttgart 21 wird darüber hinaus der Fragestellung nachgegangen, wie sich eine Öffentliche Bibliothek zu Sachverhalten positioniert, die (nicht nur) kommunalpolitisch brisant sind.
Mehr Chancen als Risiken
(2011)
Anne Christensen spricht von partizipativer Entwicklung, wenn sie sich zum Komplex Bibliothek 2.0 äußert, und meint damit primär die stärkere Einbeziehung der Benutzer, wenn es um die Zukunft der kollaborativen Erschließung von Medien in Bibliothekskatalogen geht.1 Diese Art der Partizipation tangiert Kernaufgaben sowohl an Öffentlichen als auch an wissenschaftlichen Bibliotheken. Über die Beteiligung der Benutzer am Katalog 2.0 hinaus könnte auch durch eine weitere Form der Partizipation Einfl uss auf die Zukunft Öffentlicher Bibliotheken genommen werden: durch den Bürgerhaushalt.
Verfügbare Allianz- und Nationallizenzen können eine Open-Access-Komponente beinhalten. Diese räumen den autorisierten Autoren oder Einrichtungen bestimmte Open-Access-Rechte zur Zweitveröffentlichung ein. Vorhandene Lizenzrechte zur Realisierung des Grünen Weges können somit zukünftig verstärkt genutzt werden. Dabei kann die Bibliothek eine aktive Rolle einnehmen. Präsentiert wird ein Workflow, der sich an der Checkliste für Repository-Manager orientiert. Sieben herausgearbeitete Schritte werden genannt und näher erläutert. An Beispielen wurde der Workflow getestet. Die Ergebnisse werden ebenfalls vorgestellt. Die Erweiterung des Workflows zur Identifizierung von Publikationen für die Zweitveröffentlichung lässt sich ggf. auch auf Creative-Commons-Lizenzen anwenden bzw. auf Zeitschriften, die keine Open-Access-Komponente haben.