Fremdwahrnehmungen in Reiseberichten 1500-1875 - eine computergestützte Analyse
Perceptions of the Other in Travelogues 1500-1875 - A Computerized Analysis
DACH: Österreich - Deutschland - Schweiz
Wissenschaftsdisziplinen
Geschichte, Archäologie (40%); Informatik (40%); Medien- und Kommunikationswissenschaften (20%)
Keywords
-
Digital Humanities,
History,
Computer Science,
Travelogues,
Text-Mining/Topic-Modelling,
Perceptions of the Other and the Orient
Reiseberichte sind eine wichtige Quelle für die Geschichtswissenschaft. Sie enthalten sowohl Informationen über verschiedenste Regionen, Kulturen und Religionen als auch über die Autoren und deren kulturelle Selbstwahrnehmung. Jedoch sind Reiseberichte eine sehr heterogene Quellengattung, denn der Verfasserkreis setzte sich aus Personen unterschiedlichster Herkunft zusammen. Ebenso variierten die Ziele, Motive, Darstellungsformen, Schreibintentionen sowie das Lesepublikum. Die Analyse von Reiseberichten ist daher sehr anspruchsvoll und komplex. Daher wurden bisher hauptsächlich einzelne Reiseberichte untersucht. Um diese Herausforderungen der Analyse von Reiseberichten zu meistern, wird in diesem Projekt eine neue digitale Methode entwickelt. Österreichische und deutsche Wissenschaftler und Wissenschaftlerinnen aus den Geschichts-, Computer-, Buch- und Informationswissenschaften werden zusammenarbeiten, um eine digitalisierte Sammlung von mehreren tausend deutschsprachigen, gedruckten Reiseberichten, die zwischen 1500 bis 1875 erschienen sind, zu analysieren. Diese digitale Methode basiert unter anderem auf folgenden Komponenten: Der automatischen Erkennung von Reiseberichten im historischen Bestand der österreichischen Nationalbibliothek, welcher aus ca. 600.000 Bänden besteht und zurzeit durch das Austrian Books Online Projekt digitalisiert wird. Des Weiteren, aus der automatischen Identifizierung von Textpassagen die Fremdwahrnehmung ausdrücken und dem Zusammenfassen der gefundenen Reiseberichte in einer Datenbank, wobei in dieser auch weiterführende Informationen, wie Name oder Geburtsort der Reisenden, enthalten sind. Die entwickelte Methode wird so konstruiert, dass diese für Forschende anderer Disziplinen leicht adaptierbar ist und bildet so das Fundament für weitere Forschungen an ähnlichen Fragestellungen aber anderen Quellengattungen. Folgende drei Fragekomplexe werden im Projekt untersucht: Was sind die Charakteristika von Reiseberichten? An welchen spezifischen Elementen kann man sie von anderen Textarten unterscheiden? Wie kann dies automatisiert werden? Wie wurde Fremdheit in Reiseberichten ausgedrückt? Änderte sich die Art und Weise im Laufe der Zeit, z.B. durch Umschwenken von Angst zu Spott, von Antipathie zu Interesse? Wie wurde der Orient in den Reisberichten beschrieben? Inwiefern waren diese Reiseberichte Teil der allgemeinen Diskussionen über diese Region und deren Einwohner? Veränderte sich diese Diskussion im Lauf der Zeit? Dabei wird auf die, in den Reiseberichten artikulierten Wahrnehmungen des Fremden und des Orients, fokussiert werden. Jeder von uns ist im Alltag ständig mit der Wahrnehmung von Fremdheit, besonders durch umfassende Prozesse wie beispielsweise dem weltumspannenden Massentourismus, der Internationalisierung von Konsumkulturen, transnationale Migrationsbewegungen und der Globalisierung, konfrontiert. Eine kritische Auseinandersetzung mit der historischen Dimension von Fremdwahrnehmung in Reiseberichten erlaubt es, historisches Orientierungswissen für die Gegenwart und Zukunft zu generieren.
Das interdisziplinäre Projekt erforschte alle deutschsprachigen Reiseberichte der Österreichischen Nationalbibliothek, die zwischen 1500 und 1876 erschienen, mit Hilfe digitaler Theorien und Methoden. Um die Wahrnehmungen des "Fremden" und des "Orient" (Osmanisches Reich, Perserreich). Beteiligt waren Wissenschaftler:innen des Instituts für die Erforschung der Habsburgermonarchie und des Balkanraumes (IHB) der Österreichischen Akademie der Wissenschaften, des Austrian Institute of Technology (AIT), des Fachbereichs Geschichte der Universität Salzburg, der Österreichischen Nationalbibliothek (ÖNB) und des Forschungszentrums L3S an der Universität Hannover. Ergebnisse: 1. Als eines der wichtigsten Ergebnisse ist festzuhalten, dass das Projektteam fast 5.000 Reiseberichte in den digitalen und analogen Beständen der ÖNB identifizierte. Auf der Grundlage von Titel- und Schlagwortrecherchen erstellte das Team halbautomatisch Sets möglicher Reiseberichte, die anschließend manuell verifiziert wurden. Diese Daten dienten anschließend als Basis für die Entwicklung von Algorithmen zur automatischen Erkennung von Reiseberichten in den Sammlungen der ÖNB. Auf diese Weise war es dem Team möglich, weitere Reiseberichte, die in der Forschung bislang unbekannt waren, zu identifizieren. Diese Methode ist sowohl für die Geisteswissenschaften als auch die Informatik von großer Bedeutung, da sie absolut neu ist und die Anwendbarkeit von machine learning bei der Identifizierung bestimmter Textsorten bewiesen hat. Sie hat auch dann funktioniert, wenn die die Qualität der maschinell kodierten Texte (OCR) von schlechter Qualität war, ein Problem, das bei älteren Texten immer wieder auftritt. Hierfür wurde das Projekt mit dem Lee Dirks Award for Best Full Paper ausgezeichnet. In der Zwischenzeit haben andere Projekte diese Methode überprüft und übernommen. 2. Als weiteres Ergebnis sicherte das Projekt europäisches kulturelles Erbe, da es den größten Korpus an (digital verfügbaren) deutschsprachigen Reiseberichten überhaupt schuf. Der größte Teil der Quellen ist nun im Online-Bibliothekskatalog der ÖNB für die Öffentlichkeit digitalisiert zugänglich. 3. Die manuell überprüften und wesentlich verbesserten Metadaten der Reiseberichte (Angaben zu Verfasser usw.) erhöhen die Erschließungspotentiale des Textkorpus für die Wissenschaft wesentlich. 5. Identische Textpassagen ("Textwiederverwendung") in Reiseberichten über den "Orient" wurden mit Hilfe eines ursprünglich in der Bioinformatik etablierten Algorithmus zum schnellen DNA-Sequenzabgleich identifiziert. Die Ergebnisse sind vielversprechend, zeigen aber, dass die OCR-Qualität entscheidend ist und dass Wege zum Ausgleich von unterschiedlichen Schreibweisen, Synonymen und verbalen Variationen gleichen und ähnlichen Inhalts noch genauer erschlossen werden müssen. 6. Die halbautomatische Identifizierung von Wahrnehmungen des "Anderen" erwies sich aufgrund der unzureichenden OCR-Qualität vieler Texte derzeit als nicht machbar. Allerdings wurde zu diesem Thema mit Hilfe klassischer Methoden ein Sammelband erstellt, der 2022 erscheinen wird.
- Bernhard Haslhofer, Austrian Institute of Technology - AIT , assoziierte:r Forschungspartner:in
- Maximilian Kaiser, Österreichische Nationalbibliothek , assoziierte:r Forschungspartner:in
- Markus Brantl, Bayerische Staatsbibliothek München - Deutschland
- Patrick Sahle, Bergische Universität Wuppertal - Deutschland
- Wolfgang Nejdl, Leibniz Universität Hannover - Deutschland
- Manfred Thaller, Universität Köln - Deutschland
- Hans-Christof Kraus, Universität Passau - Deutschland
- Malte Rehbein, Universität Passau - Deutschland
- Merrick Lex Berman, Harvard University - Vereinigte Staaten von Amerika
- Tom Elliott, New York University - Vereinigte Staaten von Amerika
- Katherine Weimer, Rice University Houston - Vereinigte Staaten von Amerika
- Carl Lagoze, University of Michigan - Vereinigte Staaten von Amerika
- Elton Barker, The Open University - Vereinigtes Königreich
- Jane Winters, University of London - Vereinigtes Königreich
Research Output
- 22 Zitationen
- 14 Publikationen
- 2 Methoden & Materialien
- 1 Disseminationen
- 1 Wissenschaftliche Auszeichnungen
- 1 Weitere Förderungen
-
2024
Titel Intertextualität; In: Digital Humanities in den Geschichtswissenschaften Typ Book Chapter Autor Gruber D Verlag Böhlau Seiten 18 -
2021
Titel Neural OCR Post-Hoc Correction of Historical Corpora DOI 10.48550/arxiv.2102.00583 Typ Preprint Autor Lyu L -
2021
Titel Neural OCR Post-Hoc Correction of Historical Corpora DOI 10.1162/tacl_a_00379 Typ Journal Article Autor Lyu L Journal Transactions of the Association for Computational Linguistics Seiten 479-493 Link Publikation -
2018
Titel Traveling through Space and Time, or: Making Historical Travelogues Accessible; In: Proceedings of the 18th European Networked Knowledge Organization Systems (NKOS) Workshop, co-located with the 22nd International Conference on Theory and Practice of Digital Libraries 2018 Typ Book Chapter Autor Rörden Link Publikation -
2021
Titel Neural OCR Post-Hoc Correction of Historical Corpora DOI 10.15488/15073 Typ Other Autor Koutraki M Link Publikation -
2021
Titel Knowledge in Transition DOI 10.7767/9783205214069.163 Typ Book Chapter Autor Gruber D Verlag Brill Osterreich Seiten 163-178 -
2020
Titel Identifying Historical Travelogues in Large Text Corpora Using Machine Learning DOI 10.48550/arxiv.2001.01673 Typ Preprint Autor Rörden J -
2020
Titel On the Way into the Unknown? Comparative Perspectives on the "Orient" in (Early) Modern Travelogues Typ Other Autor Lisa Brunner Link Publikation -
2020
Titel Identifying Historical Travelogues in Large Text Corpora Using Machine Learning DOI 10.1007/978-3-030-43687-2_67 Typ Book Chapter Autor Rörden J Verlag Springer Nature Seiten 801-815 -
2020
Titel TRAVELOGUES: FREMDWAHRNEHMUNGEN IN REISEBERICHTEN 1500–1876 DOI 10.1553/dha-proceedings2018s62 Typ Conference Proceeding Abstract Autor Gruber D Seiten 62-66 Link Publikation -
2022
Titel Europeans Encounter the World in Travelogues: 1450-1900 Typ Journal Article Autor Doris Gruber Journal Europäische Geschichte Online -
2019
Titel Japan and the Ottoman Empire in the Eye of the European Beholder. A Comparison Typ Other Autor Doris Gruber Link Publikation -
2019
Titel Travelogues – Perceptions of the Other 1500–1876. A Computerized Analysis DOI 10.7767/9783205209096.129 Typ Book Chapter Autor Gruber D Verlag Brill Osterreich Seiten 129-132 Link Publikation -
2020
Titel Austrian Books Online – Acht Jahre Digitalisierung des historischen Buchbestandes der Österreichischen Nationalbibliothek mit Google DOI 10.1515/bfp-2020-0008 Typ Journal Article Autor Fritze C Journal Bibliothek Forschung und Praxis Seiten 89-99 Link Publikation
-
2020
Titel Lee Dirks Award Typ Research prize Bekanntheitsgrad Continental/International
-
2022
Titel Scholarship Typ Research grant (including intramural programme) Förderbeginn 2022 Geldgeber Herzog August Library