Computerunterstützte Übersetzung von Wortspielen
Computational Pun-derstanding
Wissenschaftsdisziplinen
Andere Geisteswissenschaften (10%); Sprach- und Literaturwissenschaften (90%)
Keywords
-
Computational Humour,
Natural Language Processing,
Humour Studies,
Puns,
Computational Linguistics,
Computer-Assisted Translation
Kreative Sprache, wie Humor und Wortspiele, sind überall zu finden: jeden Tag amüsieren uns geschickte Werbesprüche, unsere Fernseher und Kinos zeigen endlose Reihen redegewandter Komödien, und Literaturkritiker schreiben ganze Bände über den Witz moderner und klassischer Autoren. Die Allgegenwärtigkeit kreativer Sprache, und der stetige Bedarf an kreativen Fachleuten, die solche Sprache analysieren und übersetzenlässt sie als einen hervorragenden Kandidaten für automatische Sprachverarbeitungstechniken wie maschinelle Übersetzung erscheinen. Computer haben jedoch erhebliche Schwierigkeiten, mit den Tücken kreativer Sprache umzugehen. Dies ist darauf zurückzuführen, dass Computer Anomalien und Mehrdeutigkeiten in Eingaben als Dinge ansehen, die zugunsten einer einzigen richtigen Interpretation beseitigt werden müssen, statt sie zu erhalten und auf ihre eigene Art zu interpretieren. Wenn Computer also kreative Sprache nicht selbst übersetzen können, können sie zumindest kreative Fachleute beim Übersetzen von Wortspielen unterstützen? DasÜbersetzenvonWortspielen ist eines der meisterforschten Problemein der Übersetzungswissenschaft, dem im Bereich Künstliche Intelligenz bisher wenig Aufmerksamkeit gewidmet wurde. In diesem Projekt untersuchen wir, wie professionelle Übersetzer Wortspiele verarbeiten, mit besonderem Augenmerk auf verwendete Werkzeuge, Wissensquellen und Arbeitsprozesse. Wir werden diese Prozesse aufgliedern und Teile identifizieren, die als Teil eines interaktiven, computergestützten Übersetzungssystems modelliert werden können. In diesem machine-in-the-loop-Paradigma wird Sprachtechnologie nur auf diejenigen Teilaufgaben angewandt werden, die sie am besten erfüllen kann, wie z.B. das Durchsuchen eines großen Wortschatzes nach Übersetzungsvorschlägen, die mit bestimmten phonetischen und semantischen Bedingungen übereinstimmen. Teilaufgaben, die stark von realweltlichem Hintergrundwissen abhängen, wie z.B. das Auswählen des Vorschlags, der im breiten, humoristischen Kontext am besten passt, werden dem menschlichen Übersetzer überlassen werden. Um dieses Ziel zu erreichen, wird es nötig sein, innovative und interaktive Techniken zu entwickeln, die Instanzen von Wortspielen identifizieren, die ihre Semantik erforschen und interpretieren, und die Vorschläge in der Zielsprache generieren, die die Mehrdeutigkeit und den Humor des Originals am besten treffen. Die wissenschaftliche Innovation des Projekts liegt in seiner Verbindung von bisher getrennten Forschungsbereichen: linguistische Humortheorie, computerbasierte Analyse von Wortbedeutungen, manuelle Übersetzung von Wortspielen und computergestützte Übersetzungstechnologie. Neben neuen Einblicken in die linguistischen Prozesse und Übersetzungsstrategien für Wortspiele verfügt die Forschung über das Potenzial, professioneller Übersetzer beim Arbeiten mit kreativer Sprache erheblich zu entlasten, indem kreative Lösungen zu unkonventionellen Übersetzungsprobleme gefördert werden.
Humor und Wortspiele sind in Literatur, Fernsehsendungen, Filmen, und Werbung weit verbreitet. Der stetige Bedarf an kreativen Fachleuten, die dieses Material produzieren, analysieren und übersetzen, lässt es als einen hervorragenden Kandidaten für automatische Sprachverarbeitungstechniken erscheinen, wie beispielsweise maschinelle Übersetzung. Computer haben jedoch erhebliche Schwierigkeiten, mit den Tücken kreativer Sprache umzugehen. Dies ist darauf zurückzuführen, dass Computer Anomalien und Mehrdeutigkeiten im Quelltext als etwas ansehen, das zugunsten einer einzigen "richtigen" Interpretation aufgelöst werden muss, anstatt es zu erhalten und auf eine eigene Art zu interpretieren. Wenn Computer also kreative Sprache nicht selbst übersetzen können, können sie zumindest kreative Fachleute beim Übersetzen gezielt unterstützen? Ziel dieses Projektes war zu untersuchen, wie menschliche ÜbersetzerInnen Wortspiele verarbeiten, mit besonderem Augenmerk auf verwendete Werkzeuge, Wissensquellen und Arbeitsprozesse, um sie anschließend als Teil eines interaktiven, computergestützten Übersetzungssystems zu modellieren. Mit diesem "machine-in-the-loop" Paradigma wird Sprachtechnologie nur auf diejenigen Teilaufgaben angewendet, die sie am besten erfüllen kann. Die grundlegend menschlichen Aspekte der Übersetzung sind dem/der BenutzerIn überlassen. Das im Projekt entwickelte Übersetzungssystem PunCAT übersetzt jede Interpretation eines Wortspiels einzeln und automatisch. Anschließend ermöglicht es dem/der BenutzerIn, die semantische Nachbarschaft dieser Übersetzungen interaktiv zu erforschen. Dabei hilft das System der/dem ÜbersetzerIn, ein Wortspiel in der Zielsprache zu produzieren, wobei der Sinn - oder mindestens die generelle Absicht - erhalten bleibt. Wir haben PunCAT in einer Pilotstudie evaluiert, in der menschliche ÜbersetzerInnen englische Wortspiele mit bzw. ohne Computerunterstützung ins Deutsche übersetzt haben. Unsere Triangulierung von Datenlogging, Fragebogen, handschriftlicher Notizen und Zieltexten hat eine solide Grundlage gestellt, um die Interaktion zwischen der/den TeilnehmerInnen und dem System zu untersuchen. Die Analyse der Daten hat gezeigt, dass PunCAT den Übersetzungsprozess effektiv unterstützen kann, zum Beispiel durch die Förderung von Brainstorming, die Anregung zu kreativem Denken, und dem Bereitstellen von inspirativen Vorschlägen. Durch seinen Zugriff auf größere semantische Netze als die traditionelle Wörterbuchsuche kann PunCAT den Pool von Lösungskandidaten maßgeblich erweitern. Unsere Studie hat jedoch auch gezeigt, dass verschiedene ÜbersetzerInnen unterschiedliche Arbeitsstile und -prozesse verwenden. PunCAT ist daher möglicherweise für einige passender als für andere. Ziel der Zusammenführung von linguistischer Datenverarbeitung und kognitiven Ansätzen war eine Antwort auf die anhaltende Nachfrage nach maschinellen Übersetzungswerkzeugen zu finden, die tatsächliche Arbeitsprozesse und praxisnahe Bedürfnisse der ÜbersetzerInnen berücksichtigen. Unserer Meinung nach ist eine weiterführende Integration dieser beiden Bereiche ein erfolgsversprechender Schritt, um die Übersetzung im Allgemeinen zu unterstützen, insbesondere bei Übersetzungsproblemen dieser außergewöhnlichen Kategorie.
Research Output
- 41 Zitationen
- 24 Publikationen
- 2 Datasets & Models
- 2 Software
- 9 Disseminationen
- 6 Wissenschaftliche Auszeichnungen
-
2024
Titel On the use of scale distortion for visual humour a preliminary analysis DOI 10.7592/ejhr.2024.12.2.904 Typ Journal Article Autor Miller T Journal The European Journal of Humour Research -
2022
Titel Human–computer interaction in pun translation DOI 10.4324/9781003094159-4 Typ Book Chapter Autor Kolb W Verlag Taylor & Francis Seiten 66-88 Link Publikation -
2022
Titel Overview of JOKER@CLEF 2022: Automatic Wordplay and Humour Translation Workshop DOI 10.1007/978-3-031-13643-6_27 Typ Book Chapter Autor Ermakova L Verlag Springer Nature Seiten 447-469 -
2022
Titel Overview of the CLEF 2022 JOKER Task 2: Translate Wordplay in Named Entities Typ Other Autor Ermakova L. Seiten 1666-1680 Link Publikation -
2022
Titel Overview of the CLEF 2022 JOKER Task 3: Pun Translation from English into French Typ Other Autor Ermakova L. Seiten 1681-1700 Link Publikation -
2022
Titel Overview of the CLEF 2022 JOKER Task 1: Classify and Explain Instances of Wordplay Typ Other Autor Ermakova L. Seiten 1641-1665 Link Publikation -
2021
Titel SemEval-2021 Task 12: Learning with Disagreements DOI 10.18653/v1/2021.semeval-1.41 Typ Conference Proceeding Abstract Autor Uma A Seiten 338-347 Link Publikation -
2020
Titel Predicting humorousness and metaphor novelty with Gaussian process preference learning Typ Other Autor Dinh E.-L.D. Seiten 5716-5728 Link Publikation -
2020
Titel Don't Shun the Pun: On the Requirements and Constraints for Preserving Ambiguity in the (Machine) Translation of Humour Typ Conference Proceeding Abstract Autor Miller T Konferenz 3rd Workshop on Natural Language Processing for Requirements Engineering Link Publikation -
2020
Titel Predicting the Humorousness of Tweets Using Gaussian Process Preference Learning Typ Journal Article Autor Do Dinh E Journal Procesamiento del Lenguaje Natural Seiten 37-44 Link Publikation -
2021
Titel End-to-end Style-Conditioned Poetry Generation: What Does It Take to Learn from Examples Alone? Typ Conference Proceeding Abstract Autor Haider T Konferenz 5th Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature (LaTeCH-CLfL 2021) Seiten 57-66 Link Publikation -
2021
Titel End-to-end style-conditioned poetry generation: What does it take to learn from examples alone? DOI 10.18653/v1/2021.latechclfl-1.7 Typ Conference Proceeding Abstract Autor Haider T Seiten 57-66 Link Publikation -
2019
Titel Reinhold Aman, 1936–2019 DOI 10.1515/humor-2019-0085 Typ Journal Article Autor Miller T Journal HUMOR Seiten 1-5 Link Publikation -
2019
Titel Predicting Humorousness and Metaphor Novelty with Gaussian Process Preference Learning DOI 10.18653/v1/p19-1572 Typ Conference Proceeding Abstract Autor Simpson E Seiten 5716-5728 Link Publikation -
2022
Titel CLEF Workshop JOKER: Automatic Wordplay and Humour Translation DOI 10.1007/978-3-030-99739-7_45 Typ Book Chapter Autor Ermakova L Verlag Springer Nature Seiten 355-363 -
2019
Titel OfAI-UKP at HAHA@IberLEF2019: Predicting the humorousness of tweets using Gaussian process preference learning Typ Other Autor Do Dinh E.-L. Seiten 180-190 Link Publikation -
2019
Titel OFAI-UKP at HAHA@IberLEF2019: Predicting the humorousness of tweets using Gaussian process preference learning Typ Conference Proceeding Abstract Autor Do Dinh E Konferenz Iberian Languages Evaluation Forum Seiten 180-190 -
2019
Titel OFAI-UKP at HAHA@IberLEF2019: Predicting the humorousness of tweets using Gaussian process preference learning Typ Conference Proceeding Abstract -
2019
Titel Reinhold Aman (1936-2019) Typ Other Autor Miller T Konferenz The LINGUIST List Link Publikation -
2020
Titel Predicting the humorousness of tweets using Gaussian process preference learning Identificando el humor de tuits utilizando el aprendizaje de preferencias basado en procesos gaussianos DOI 10.26342/2020-64-4 Typ Journal Article Autor Dinh E.-L.D. Journal Procesamiento del Lenguaje Natural Seiten 37-44 Link Publikation -
2020
Titel GPP, the Generic Preprocessor DOI 10.48550/arxiv.2008.00840 Typ Preprint Autor Miller T -
2020
Titel Predicting the Humorousness of Tweets Using Gaussian Process Preference Learning DOI 10.48550/arxiv.2008.00853 Typ Preprint Autor Miller T -
2020
Titel GPP, the Generic Preprocessor DOI 10.21105/joss.02400 Typ Journal Article Autor Miller T Journal Journal of Open Source Software Seiten 2400 Link Publikation -
2020
Titel Reader’s Queries DOI 10.1093/notesj/gjaa113 Typ Journal Article Autor Miller T Journal Notes and Queries Seiten 431-432 Link Publikation
-
2021
Link
Titel PunCAT Link Link -
2020
Link
Titel GPP, the Generic Preprocessor DOI 10.5281/zenodo.3961322 Link Link
-
2020
Link
Titel MTA article Typ A magazine, newsletter or online publication Link Link -
2020
Link
Titel OFAI Twitter feed Typ Engagement focused website, blog or social media channel Link Link -
2019
Link
Titel OFAI website Typ Engagement focused website, blog or social media channel Link Link -
2020
Link
Titel Ö1 interview Typ A press release, press conference or response to a media enquiry/interview Link Link -
2020
Link
Titel OFAI Facebook page Typ Engagement focused website, blog or social media channel Link Link -
2021
Link
Titel 1E9 interview Typ A press release, press conference or response to a media enquiry/interview Link Link -
2020
Titel OFAI student lab visit Typ Participation in an open day or visit at my research institution -
2019
Link
Titel Project website Typ Engagement focused website, blog or social media channel Link Link -
2021
Link
Titel Abkhaz State University interview Typ A press release, press conference or response to a media enquiry/interview Link Link
-
2019
Titel Invited talk at Brainstorms Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Regional (any country) -
2019
Titel Outstanding Reviewer, 2019 Conference on Empirical Methods in Natural Language Processing and 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP 2019) Typ Research prize Bekanntheitsgrad Continental/International -
2019
Titel Invited talk at the 2nd Comedy and AI Conference Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad National (any country) -
2021
Titel Invited talk at Words/Machines-2021 Typ Personally asked as a key note speaker to a conference Bekanntheitsgrad Regional (any country) -
2021
Titel Outstanding Reviewer, 16th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2021) Typ Research prize Bekanntheitsgrad Continental/International -
2020
Titel Consulting Editor for Humor: International Journal of Humor Research Typ Appointed as the editor/advisor to a journal or book series Bekanntheitsgrad Continental/International