• Treffer 1 von 1
Zurück zur Trefferliste

“Broadcast your gender.”

  • Social media platforms provide a large array of behavioral data relevant to social scientific research. However, key information such as sociodemographic characteristics of agents are often missing. This paper aims to compare four methods of classifying social attributes from text. Specifically, we are interested in estimating the gender of German social media creators. By using the example of a random sample of 200 YouTube channels, we compare several classification methods, namely (1) a survey among university staff, (2) a name dictionary method with the World Gender Name Dictionary as a reference list, (3) an algorithmic approach using the website gender-api.com, and (4) a Multinomial Naïve Bayes (MNB) machine learning technique. These different methods identify gender attributes based on YouTube channel names and descriptions in German but are adaptable to other languages. Our contribution will evaluate the share of identifiable channels, accuracy and meaningfulness of classification, as well as limits and benefits of eachSocial media platforms provide a large array of behavioral data relevant to social scientific research. However, key information such as sociodemographic characteristics of agents are often missing. This paper aims to compare four methods of classifying social attributes from text. Specifically, we are interested in estimating the gender of German social media creators. By using the example of a random sample of 200 YouTube channels, we compare several classification methods, namely (1) a survey among university staff, (2) a name dictionary method with the World Gender Name Dictionary as a reference list, (3) an algorithmic approach using the website gender-api.com, and (4) a Multinomial Naïve Bayes (MNB) machine learning technique. These different methods identify gender attributes based on YouTube channel names and descriptions in German but are adaptable to other languages. Our contribution will evaluate the share of identifiable channels, accuracy and meaningfulness of classification, as well as limits and benefits of each approach. We aim to address methodological challenges connected to classifying gender attributes for YouTube channels as well as related to reinforcing stereotypes and ethical implications.zeige mehrzeige weniger

Volltext Dateien herunterladen

  • SHA-512:9f535d9d2f755d433480674868af97c1716b3a65ff91823f46fd5d6ad4f69535bead63cea041ffb557a5d193abb947d2ce84caa419688e29e71e9932a4016580

Metadaten exportieren

Weitere Dienste

Suche bei Google Scholar Statistik - Anzahl der Zugriffe auf das Dokument
Metadaten
Verfasserangaben:Lena SeewannORCiDGND, Roland VerwiebeORCiDGND, Claudia Buder, Nina-Sophie FritschORCiDGND
URN:urn:nbn:de:kobv:517-opus4-566287
DOI:https://doi.org/10.25932/publishup-56628
ISSN:1867-5808
Titel des übergeordneten Werks (Deutsch):Zweitveröffentlichungen der Universität Potsdam : Wirtschafts- und Sozialwissenschaftliche Reihe
Untertitel (Englisch):A comparison of four text-based classification methods of German YouTube channels
Schriftenreihe (Bandnummer):Zweitveröffentlichungen der Universität Potsdam : Wirtschafts- und Sozialwissenschaftliche Reihe (152)
Sonstige beteiligte Person(en):Dmitri Prandner, Heinz Leitgöb, Robert Moosbrugger
Publikationstyp:Postprint
Sprache:Englisch
Datum der Erstveröffentlichung:09.11.2022
Erscheinungsjahr:2022
Veröffentlichende Institution:Universität Potsdam
Datum der Freischaltung:09.11.2022
Freies Schlagwort / Tag:YouTube; authorship attribution; gender; machine learning; text based classification methods
Ausgabe:152
Seitenanzahl:16
Organisationseinheiten:Wirtschafts- und Sozialwissenschaftliche Fakultät / Sozialwissenschaften
DDC-Klassifikation:0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik
Peer Review:Referiert
Publikationsweg:Open Access / Green Open-Access
Lizenz (Deutsch):License LogoCC-BY - Namensnennung 4.0 International
Externe Anmerkung:Bibliographieeintrag der Originalveröffentlichung/Quelle
Verstanden ✔
Diese Webseite verwendet technisch erforderliche Session-Cookies. Durch die weitere Nutzung der Webseite stimmen Sie diesem zu. Unsere Datenschutzerklärung finden Sie hier.