Filtern
Volltext vorhanden
- nein (4)
Dokumenttyp
- Wissenschaftlicher Artikel (4) (entfernen)
Gehört zur Bibliographie
- ja (4) (entfernen)
Schlagworte
- COVID-19 (1)
- Digital Humanities (1)
- German literature (1)
- Literaturbetrieb (1)
- Literaturkritik (1)
- Literaturpreise (1)
- Literatursoziologie (1)
- Soziodemographische Analyse (1)
- automated text analysis (1)
- computer-assisted text analysis (1)
Institut
Wir nehmen eine vergleichende Untersuchung der Nominierten und Preisträger:innen von sieben Buchpreisen im deutschsprachigen Raum vor, die mit einer vorab veröffentlichten Long- und/oder Shortlist arbeiten. Dazu vergleichen wir die Preise in Bezug auf soziodemographische Faktoren der Autor:innen (Geschlecht, Alter und Muttersprache), deren Bekanntheit zum Zeitpunkt der Nominierung (Aufrufe auf Wikipedia), die Anzahl vorheriger Nominierungen der Autor:innen für den gleichen Buchpreis, die ›Qualität‹ der ausgezeichneten Bücher (Anzahl der Rezensionen des nominierten Buches, positive bzw. negative Beurteilung in Rezensionen sowie die Einigkeit der Rezensent:innen darüber), das Ansehen der Verlage und die Geschlechterzusammensetzung der Jurys. Der Analysezeitraum umfasst 15 Jahre. Unser Datensatz beinhaltet Informationen zu 428 Autor:innen mit insgesamt 627 zwischen den Jahren 2005 und 2020 nominierten Büchern und 2.469 Rezensionen zu diesen Büchern. Der Datensatz wurde mittels mehrerer Methoden (z. B. Web-Scraping, Hand-Kodierung, Expert:innenbewertungen) aus verschiedenen Quellen (z. B. Web-Daten, Bibliothekskataloge, Expert:innenbewertungen) zusammengestellt. Auf diese Weise können wir unter anderem zeigen, dass für alle untersuchten Preise überwiegend deutsche Muttersprachler:innen mit gut rezensierten Büchern aus renommierten Verlagen nominiert werden und die Preise gewinnen.
Can we rely on computational methods to accurately analyze complex texts? To answer this question, we compared different dictionary and scaling methods used in predicting the sentiment of German literature reviews to the "gold standard " of human-coded sentiments. Literature reviews constitute a challenging text corpus for computational analysis as they not only contain different text levels-for example, a summary of the work and the reviewer's appraisal-but are also characterized by subtle and ambiguous language elements. To take the nuanced sentiments of literature reviews into account, we worked with a metric rather than a dichotomous scale for sentiment analysis. The results of our analyses show that the predicted sentiments of prefabricated dictionaries, which are computationally efficient and require minimal adaption, have a low to medium correlation with the human-coded sentiments (r between 0.32 and 0.39). The accuracy of self-created dictionaries using word embeddings (both pre-trained and self-trained) was considerably lower (r between 0.10 and 0.28). Given the high coding intensity and contingency on seed selection as well as the degree of data pre-processing of word embeddings that we found with our data, we would not recommend them for complex texts without further adaptation. While fully automated approaches appear not to work in accurately predicting text sentiments with complex texts such as ours, we found relatively high correlations with a semiautomated approach (r of around 0.6)-which, however, requires intensive human coding efforts for the training dataset. In addition to illustrating the benefits and limits of computational approaches in analyzing complex text corpora and the potential of metric rather than binary scales of text sentiment, we also provide a practical guide for researchers to select an appropriate method and degree of pre-processing when working with complex texts.
This paper examines and discusses the biases and pitfalls of retrospective survey questions that are currently being used in many medical, epidemiological, and sociological studies on the COVID-19 pandemic. By analyzing the consistency of answers to retrospective questions provided by respondents who participated in the first two waves of a survey on the social consequences of the COVID-19 pandemic, we illustrate the insights generated by a large body of survey research on the use of retrospective questions and recall accuracy.