Projektdetail

Grant-DOI 10.55776/M2625
Bewilligungssumme Lise Meitner
Status beendet
Projektbeginn 16.04.2019
Projektende 15.07.2021
Bewilligungssumme 169.260 €
Projekt-Website

Wissenschaftsdisziplinen

Andere Geisteswissenschaften (10%); Sprach- und Literaturwissenschaften (90%)

Keywords

Computational Humour,
Natural Language Processing,
Humour Studies,
Puns,
Computational Linguistics,
Computer-Assisted Translation

Abstract

Zusammenfassung

Kreative Sprache, wie Humor und Wortspiele, sind überall zu finden: jeden Tag amüsieren uns geschickte Werbesprüche, unsere Fernseher und Kinos zeigen endlose Reihen redegewandter Komödien, und Literaturkritiker schreiben ganze Bände über den Witz moderner und klassischer Autoren. Die Allgegenwärtigkeit kreativer Sprache, und der stetige Bedarf an kreativen Fachleuten, die solche Sprache analysieren und übersetzenlässt sie als einen hervorragenden Kandidaten für automatische Sprachverarbeitungstechniken wie maschinelle Übersetzung erscheinen. Computer haben jedoch erhebliche Schwierigkeiten, mit den Tücken kreativer Sprache umzugehen. Dies ist darauf zurückzuführen, dass Computer Anomalien und Mehrdeutigkeiten in Eingaben als Dinge ansehen, die zugunsten einer einzigen richtigen Interpretation beseitigt werden müssen, statt sie zu erhalten und auf ihre eigene Art zu interpretieren. Wenn Computer also kreative Sprache nicht selbst übersetzen können, können sie zumindest kreative Fachleute beim Übersetzen von Wortspielen unterstützen? DasÜbersetzenvonWortspielen ist eines der meisterforschten Problemein der Übersetzungswissenschaft, dem im Bereich Künstliche Intelligenz bisher wenig Aufmerksamkeit gewidmet wurde. In diesem Projekt untersuchen wir, wie professionelle Übersetzer Wortspiele verarbeiten, mit besonderem Augenmerk auf verwendete Werkzeuge, Wissensquellen und Arbeitsprozesse. Wir werden diese Prozesse aufgliedern und Teile identifizieren, die als Teil eines interaktiven, computergestützten Übersetzungssystems modelliert werden können. In diesem machine-in-the-loop-Paradigma wird Sprachtechnologie nur auf diejenigen Teilaufgaben angewandt werden, die sie am besten erfüllen kann, wie z.B. das Durchsuchen eines großen Wortschatzes nach Übersetzungsvorschlägen, die mit bestimmten phonetischen und semantischen Bedingungen übereinstimmen. Teilaufgaben, die stark von realweltlichem Hintergrundwissen abhängen, wie z.B. das Auswählen des Vorschlags, der im breiten, humoristischen Kontext am besten passt, werden dem menschlichen Übersetzer überlassen werden. Um dieses Ziel zu erreichen, wird es nötig sein, innovative und interaktive Techniken zu entwickeln, die Instanzen von Wortspielen identifizieren, die ihre Semantik erforschen und interpretieren, und die Vorschläge in der Zielsprache generieren, die die Mehrdeutigkeit und den Humor des Originals am besten treffen. Die wissenschaftliche Innovation des Projekts liegt in seiner Verbindung von bisher getrennten Forschungsbereichen: linguistische Humortheorie, computerbasierte Analyse von Wortbedeutungen, manuelle Übersetzung von Wortspielen und computergestützte Übersetzungstechnologie. Neben neuen Einblicken in die linguistischen Prozesse und Übersetzungsstrategien für Wortspiele verfügt die Forschung über das Potenzial, professioneller Übersetzer beim Arbeiten mit kreativer Sprache erheblich zu entlasten, indem kreative Lösungen zu unkonventionellen Übersetzungsprobleme gefördert werden.

Humor und Wortspiele sind in Literatur, Fernsehsendungen, Filmen, und Werbung weit verbreitet. Der stetige Bedarf an kreativen Fachleuten, die dieses Material produzieren, analysieren und übersetzen, lässt es als einen hervorragenden Kandidaten für automatische Sprachverarbeitungstechniken erscheinen, wie beispielsweise maschinelle Übersetzung. Computer haben jedoch erhebliche Schwierigkeiten, mit den Tücken kreativer Sprache umzugehen. Dies ist darauf zurückzuführen, dass Computer Anomalien und Mehrdeutigkeiten im Quelltext als etwas ansehen, das zugunsten einer einzigen "richtigen" Interpretation aufgelöst werden muss, anstatt es zu erhalten und auf eine eigene Art zu interpretieren. Wenn Computer also kreative Sprache nicht selbst übersetzen können, können sie zumindest kreative Fachleute beim Übersetzen gezielt unterstützen? Ziel dieses Projektes war zu untersuchen, wie menschliche ÜbersetzerInnen Wortspiele verarbeiten, mit besonderem Augenmerk auf verwendete Werkzeuge, Wissensquellen und Arbeitsprozesse, um sie anschließend als Teil eines interaktiven, computergestützten Übersetzungssystems zu modellieren. Mit diesem "machine-in-the-loop" Paradigma wird Sprachtechnologie nur auf diejenigen Teilaufgaben angewendet, die sie am besten erfüllen kann. Die grundlegend menschlichen Aspekte der Übersetzung sind dem/der BenutzerIn überlassen. Das im Projekt entwickelte Übersetzungssystem PunCAT übersetzt jede Interpretation eines Wortspiels einzeln und automatisch. Anschließend ermöglicht es dem/der BenutzerIn, die semantische Nachbarschaft dieser Übersetzungen interaktiv zu erforschen. Dabei hilft das System der/dem ÜbersetzerIn, ein Wortspiel in der Zielsprache zu produzieren, wobei der Sinn - oder mindestens die generelle Absicht - erhalten bleibt. Wir haben PunCAT in einer Pilotstudie evaluiert, in der menschliche ÜbersetzerInnen englische Wortspiele mit bzw. ohne Computerunterstützung ins Deutsche übersetzt haben. Unsere Triangulierung von Datenlogging, Fragebogen, handschriftlicher Notizen und Zieltexten hat eine solide Grundlage gestellt, um die Interaktion zwischen der/den TeilnehmerInnen und dem System zu untersuchen. Die Analyse der Daten hat gezeigt, dass PunCAT den Übersetzungsprozess effektiv unterstützen kann, zum Beispiel durch die Förderung von Brainstorming, die Anregung zu kreativem Denken, und dem Bereitstellen von inspirativen Vorschlägen. Durch seinen Zugriff auf größere semantische Netze als die traditionelle Wörterbuchsuche kann PunCAT den Pool von Lösungskandidaten maßgeblich erweitern. Unsere Studie hat jedoch auch gezeigt, dass verschiedene ÜbersetzerInnen unterschiedliche Arbeitsstile und -prozesse verwenden. PunCAT ist daher möglicherweise für einige passender als für andere. Ziel der Zusammenführung von linguistischer Datenverarbeitung und kognitiven Ansätzen war eine Antwort auf die anhaltende Nachfrage nach maschinellen Übersetzungswerkzeugen zu finden, die tatsächliche Arbeitsprozesse und praxisnahe Bedürfnisse der ÜbersetzerInnen berücksichtigen. Unserer Meinung nach ist eine weiterführende Integration dieser beiden Bereiche ein erfolgsversprechender Schritt, um die Übersetzung im Allgemeinen zu unterstützen, insbesondere bei Übersetzungsproblemen dieser außergewöhnlichen Kategorie.

Forschungsstätte(n)

Österreichisches Forschungsinstitut für Artificial Intelligence (ÖFAI) - 100%

Internationale Projektbeteiligte

Christian Hempelmann, Texas A&M University - Ukraine

Research Output

41 Zitationen
25 Publikationen
2 Datasets & Models
2 Software
9 Disseminationen
6 Wissenschaftliche Auszeichnungen

Publikationen

Titel	What’s in a pun? Assessing the relationship between phonological distance and perceived funniness of punning jokes
DOI	10.1515/humor-2024-0060
Typ	Journal Article
Autor	Palmann A
Journal	HUMOR
Seiten	643-658
Link	Publikation

Titel	SemEval-2021 Task 12: Learning with Disagreements
DOI	10.18653/v1/2021.semeval-1.41
Typ	Conference Proceeding Abstract
Autor	Uma A
Seiten	338-347
Link	Publikation

Titel	Reader’s Queries
DOI	10.1093/notesj/gjaa113
Typ	Journal Article
Autor	Miller T
Journal	Notes and Queries
Seiten	431-432
Link	Publikation

Titel	GPP, the Generic Preprocessor
DOI	10.48550/arxiv.2008.00840
Typ	Preprint
Autor	Miller T

Titel	Predicting the Humorousness of Tweets Using Gaussian Process Preference Learning
DOI	10.48550/arxiv.2008.00853
Typ	Preprint
Autor	Miller T

Titel	GPP, the Generic Preprocessor
DOI	10.21105/joss.02400
Typ	Journal Article
Autor	Miller T
Journal	Journal of Open Source Software
Seiten	2400
Link	Publikation

Titel	Predicting the Humorousness of Tweets Using Gaussian Process Preference Learning
Typ	Journal Article
Autor	Do Dinh E
Journal	Procesamiento del Lenguaje Natural
Seiten	37-44
Link	Publikation

Titel	Don't Shun the Pun: On the Requirements and Constraints for Preserving Ambiguity in the (Machine) Translation of Humour
Typ	Conference Proceeding Abstract
Autor	Miller T
Konferenz	3rd Workshop on Natural Language Processing for Requirements Engineering
Link	Publikation

Titel	Predicting humorousness and metaphor novelty with Gaussian process preference learning
Typ	Other
Autor	Dinh E.-L.D.
Seiten	5716-5728
Link	Publikation

Titel	Human–computer interaction in pun translation
DOI	10.4324/9781003094159-4
Typ	Book Chapter
Autor	Kolb W
Verlag	Taylor & Francis
Seiten	66-88
Link	Publikation

Titel	Overview of JOKER@CLEF 2022: Automatic Wordplay and Humour Translation Workshop
DOI	10.1007/978-3-031-13643-6_27
Typ	Book Chapter
Autor	Ermakova L
Verlag	Springer Nature
Seiten	447-469

Titel	Reinhold Aman, 1936–2019
DOI	10.1515/humor-2019-0085
Typ	Journal Article
Autor	Miller T
Journal	HUMOR
Seiten	1-5
Link	Publikation

Titel	End-to-end style-conditioned poetry generation: What does it take to learn from examples alone?
DOI	10.18653/v1/2021.latechclfl-1.7
Typ	Conference Proceeding Abstract
Autor	Haider T
Seiten	57-66
Link	Publikation

Titel	End-to-end Style-Conditioned Poetry Generation: What Does It Take to Learn from Examples Alone?
Typ	Conference Proceeding Abstract
Autor	Haider T
Konferenz	5th Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature (LaTeCH-CLfL 2021)
Seiten	57-66
Link	Publikation

Titel	On the use of scale distortion for visual humour
DOI	10.7592/ejhr.2024.12.2.904
Typ	Journal Article
Autor	Swaboda C
Journal	The European Journal of Humour Research
Seiten	206-211
Link	Publikation

Titel	OFAI-UKP at HAHA@IberLEF2019: Predicting the humorousness of tweets using Gaussian process preference learning
Typ	Conference Proceeding Abstract
Autor	Do Dinh E
Konferenz	Iberian Languages Evaluation Forum
Seiten	180-190

Titel	OFAI-UKP at HAHA@IberLEF2019: Predicting the humorousness of tweets using Gaussian process preference learning
Typ	Conference Proceeding Abstract

Titel	Reinhold Aman (1936-2019)
Typ	Other
Autor	Miller T
Konferenz	The LINGUIST List
Link	Publikation

Titel	Predicting Humorousness and Metaphor Novelty with Gaussian Process Preference Learning
DOI	10.18653/v1/p19-1572
Typ	Conference Proceeding Abstract
Autor	Simpson E
Seiten	5716-5728
Link	Publikation

Titel	CLEF Workshop JOKER: Automatic Wordplay and Humour Translation
DOI	10.1007/978-3-030-99739-7_45
Typ	Book Chapter
Autor	Ermakova L
Verlag	Springer Nature
Seiten	355-363

Titel	Overview of the CLEF 2022 JOKER Task 2: Translate Wordplay in Named Entities
Typ	Other
Autor	Ermakova L.
Seiten	1666-1680
Link	Publikation

Titel	Overview of the CLEF 2022 JOKER Task 3: Pun Translation from English into French
Typ	Other
Autor	Ermakova L.
Seiten	1681-1700
Link	Publikation

Titel	Overview of the CLEF 2022 JOKER Task 1: Classify and Explain Instances of Wordplay
Typ	Other
Autor	Ermakova L.
Seiten	1641-1665
Link	Publikation

Titel	Predicting the humorousness of tweets using Gaussian process preference learning Identificando el humor de tuits utilizando el aprendizaje de preferencias basado en procesos gaussianos
DOI	10.26342/2020-64-4
Typ	Journal Article
Autor	Dinh E.-L.D.
Journal	Procesamiento del Lenguaje Natural
Seiten	37-44
Link	Publikation

Titel	OfAI-UKP at HAHA@IberLEF2019: Predicting the humorousness of tweets using Gaussian process preference learning
Typ	Other
Autor	Do Dinh E.-L.
Seiten	180-190
Link	Publikation

Datasets & Models

Öffentlich zugänglich
Titel	Maledicta article index
Typ	Database/Collection of data
Link	Link

Öffentlich zugänglich
Titel	SemEval-2021 Task 12 Humour Dataset
Typ	Database/Collection of data
Link	Link

Software

Titel	PunCAT
Link	Link

Titel	GPP, the Generic Preprocessor
DOI	10.5281/zenodo.3961322
Link	Link

Disseminationen

Titel	OFAI Facebook page
Typ	Engagement focused website, blog or social media channel
Link	Link

Titel	Project website
Typ	Engagement focused website, blog or social media channel
Link	Link

Titel	OFAI student lab visit
Typ	Participation in an open day or visit at my research institution

Titel	MTA article
Typ	A magazine, newsletter or online publication
Link	Link

Titel	1E9 interview
Typ	A press release, press conference or response to a media enquiry/interview
Link	Link

Titel	Ö1 interview
Typ	A press release, press conference or response to a media enquiry/interview
Link	Link

Titel	OFAI Twitter feed
Typ	Engagement focused website, blog or social media channel
Link	Link

Titel	OFAI website
Typ	Engagement focused website, blog or social media channel
Link	Link

Titel	Abkhaz State University interview
Typ	A press release, press conference or response to a media enquiry/interview
Link	Link

Wissenschaftliche Auszeichnungen

Titel	Invited talk at Brainstorms
Typ	Personally asked as a key note speaker to a conference
Bekanntheitsgrad	Regional (any country)

Titel	Outstanding Reviewer, 2019 Conference on Empirical Methods in Natural Language Processing and 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP 2019)
Typ	Research prize
Bekanntheitsgrad	Continental/International

Titel	Invited talk at the 2nd Comedy and AI Conference
Typ	Personally asked as a key note speaker to a conference
Bekanntheitsgrad	National (any country)

Titel	Invited talk at Words/Machines-2021
Typ	Personally asked as a key note speaker to a conference
Bekanntheitsgrad	Regional (any country)

Titel	Outstanding Reviewer, 16th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2021)
Typ	Research prize
Bekanntheitsgrad	Continental/International

Titel	Consulting Editor for Humor: International Journal of Humor Research
Typ	Appointed as the editor/advisor to a journal or book series
Bekanntheitsgrad	Continental/International

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

Computerunterstützte Übersetzung von Wortspielen

Computational Pun-derstanding

Wissenschaftsdisziplinen

Keywords

Research Output

Kontakt

Allgemeines

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

SOCIAL MEDIA

SCILOG

Computerunterstützte Übersetzung von Wortspielen

Computational Pun-derstanding

Wissenschaftsdisziplinen

Keywords

Research Output