Erkennung Impliziter Beleidigungen
Linguistic Methods for the Detection of Implicit Abuse
Wissenschaftsdisziplinen
Informatik (15%); Sprach- und Literaturwissenschaften (85%)
Keywords
-
Hate Speech,
Linguistic Analysis,
Implicitly Abusive Language,
Offensive Language,
Natural Language Processing
In den vergangenen Jahren wurde ein massiver Anstieg an beleidigender Sprache im Netz registriert. Methoden zur automatisierten Erkennung sollen deshalb den Betreibern von Online-Plattformen beim Auffinden solcher Äußerungen assistieren. Da beleidigende Inhalte typischerweise in der Form von schriftlichen Kommentaren geäußert werden, stellen Methoden aus der natürlichen Sprachverarbeitung eine Schlüsseltechnologie bei der Bewältigung dieser Aufgabe dar. Während sich explizite Beleidigungen, also solche, die durch beleidigende Wörter, wie z.B. Schimpfwörtern, ausgedrückt werden, relativ gut automatisch erkennen lassen, stellen implizite Beleidigungen eine Herausforderung dar. Dieses Forschungsprojekt befasst sich mit der automatischen Erkennung einiger Formen von impliziten Beleidigungen, um diese wichtige Lücke in der aktuellen Forschung zu schließen. Dazu sollen Datensätze erstellt werden, die diese Formen adäquat repräsentieren und entsprechende Klassifikationsmethoden entwickelt werden, die auf diesen Datensätzen evaluiert werden können. Eine zentrale Rolle bei der Klassifikation werden linguistische Merkmale spielen. Diese sind weitaus wichtiger für die Erkennung impliziter Beleidigungen als für die Erkennung expliziter Beleidigungen.
- Universität Wien - 100%
- Benjamin Roth, Universität Wien , nationale:r Kooperationspartner:in
- Josef Ruppenhofer, FernUniversität Hagen - Deutschland
Research Output
- 3 Publikationen
-
2024
Titel Oddballs and Misfits: Detecting Implicit Abuse in Which Identity Groups are Depicted as Deviating from the Norm DOI 10.18653/v1/2024.emnlp-main.132 Typ Conference Proceeding Abstract Autor Ruppenhofer J Seiten 2200-2218 -
2025
Titel Revisiting Implicitly Abusive Language Detection: Evaluating LLMs in Zero-Shot and Few-Shot Settings Typ Conference Proceeding Abstract Autor Dagmar Gromann Konferenz the 31st International Conference on Computational Linguistics (COLING) Seiten 3879-3898 Link Publikation -
2023
Titel Euphemistic Abuse - A New Dataset and Classification Experiments for Implicitly Abusive Language DOI 10.18653/v1/2023.emnlp-main.1012 Typ Conference Proceeding Abstract Autor Kampfmeier J Seiten 16280-16297