Sprachliche Dynamik im Großraum Tunis: Ein korpusbasierter Ansatz
Linguistic Dynamics in the Greater Tunis Area: A Corpus-based Approach
Wissenschaftsdisziplinen
Sprach- und Literaturwissenschaften (100%)
Keywords
-
Arabic dialectology,
Tunisia,
Lexicography,
Corpus linguistics
Der arabische Dialekt der tunesischen Hauptstadt hat lange Zeit zu den am ausführlichsten beschriebenen Stadtdialekten der arabischen Welt gezählt. Erste wissenschaftliche Beschreibungen gehen bereits auf das 19. Jahrhundert zurück. Der überwiegende Teil der bisher vorliegenden Arbeiten widmet sich phonologischen und morphologischen Fragen sowie soziolinguistischen Analysen. Im Gegensatz dazu fehlen syntaktische Studien und Wörterbücher, die auf authentischen Texten basieren, so gut wie vollkommen. Ebenso wenig hat sich die dialektologische Forschung mit der sprachlichen Dynamik der letzten Jahrzehnte beschäftigt, welche hauptsächlich durch tiefgreifende demographische Veränderungen in der Region ausgelöst wurde. Die heute in Tunis gesprochene Varietät des Arabischen kann mit Recht als eine Koiné bezeichnet werden, welche nicht nur im Großraum der Stadt selbst, sondern darüber hinaus auch in anderen Teilen Tunesiens verwendet wird. Das Projekt fokussiert auf die Sprache jener jungen Generation, die zwar schon in der Stadt aufgewachsen ist, deren Eltern jedoch größtenteils aus verschiedenen Regionen des Landes in den Großraum Tunis gezogen sind. Neben dem Hauptziel der Beschreibung der Sprache der unmittelbaren Gegenwart soll das Projekt zu zwei konkreten Produkten führen: einem repräsentativen digitalen Korpus, das auf authentischen und spontanen Gesprächen basiert, und einem darauf aufbauenden digitalen Wörterbuch. Offen zugängliche digitale Korpora arabischer Dialekte, welche sowohl eine linguistische Transkription als auch Übersetzungen bieten, existieren bisher so gut wie nicht. Außer als Quelle zur Erstellung eines elektronischen Wörterbuchs soll dieses Korpus auch dazu dienen, ausgewählte syntaktische und morphologische Phänomene zu untersuchen. Was das Wörterbuch betrifft, so wird es auch auf gezielten Interviews sowie Daten aus bereits publizierten Glossaren und Wortlisten gespeist werden. Damit erhält es eine diachrone Dimension, welche es erlauben wird, die sprachlichen Dynamiken im Bereich des Lexikons zu analysieren. Einer der innovativen Ansätze des Projekts liegt darin, dass es arabistisch-philologische Forschung mit modernster Informationstechnologie verknüpft und dadurch neue Perspektiven eröffnet. Die dabei verwendeten Tools und die aus dieser Kooperation gewonnenen Erfahrungen und Ergebnisse können für ähnliche strukturierte Studien genutzt werden. Dazu gehört die enge Verknüpfung von Korpus und Wörterbuch, die direkten Zugriff auf die jeweils andere Datenressource ermöglichen wird. Über ein Web-Interface werden diese Daten der Scientific Community zur Verfügung gestellt und können in Zukunft auch von anderen genutzt und erweitert werden. Besonderes Augenmerk wird auf die derzeit in der digitalen Philologie gültigen Standards sowie auf die Wiederverwertbarkeit und längerfristige Verfügbarkeit der Daten gelegt werden.
Der Dialekt von Tunis gehört in phonologischer und morphologischer Hinsicht zu den am besten erforschten arabischen Varietäten in ganz Nordafrika. Fragen der Syntax blieben jedoch bisher weitgehend unerforscht, was auch daran lag, dass es an entsprechenden Textkorpora mangelte. Ebenso wenig hat sich die dialektologische Forschung mit der sprachlichen Dynamik der letzten Jahrzehnte beschäftigt, welche durch die tiefgreifenden demographischen Veränderungen im Großraum Tunis angestoßen wurden. Neben der Untersuchung dieser Phänomene und der Erstellung einer digitalen Textsammlung umfasste das Projekt die Schaffung eines modernen Wörterbuchs, das neben dem Grundwortschatz auch neue Wortschöpfungen der Internet-Generation beinhaltet.Im Zuge längerer Feldforschungen in Tunis wurden mehr als dreißig Stunden Tonaufnahmen gemacht, auf deren Basis ein digitales, annotiertes und frei zugängliches Korpus von ca. 95.000 Wörtern entstand. Dieses reflektiert fast ausschließlich die Sprache der jungen Generation, welche sich nicht nur im Wortschatz und in der Phraseologie, sondern teilweise auch in Aussprache und Wortbildung von älteren Varietäten unterscheidet. Im Gegensatz zu den im Bereich der arabischen Dialektologie üblichen Erzähltexten enthält das Korpus vor allem spontane Gespräche. Diese ermöglichen die Analyse eines Sprachregisters, das durch den häufigen Gebrauch von Diskurspartikeln und anderen für Dialoge typische Phänomene charakterisiert ist. Im Laufe des Projekts sind bereits einige Beiträge publiziert worden, in welchen exemplarisch gezeigt wird, für welche Fragestellungen dieses Korpus vor allem im Bereich der Syntax genutzt werden kann. Die Korpus-Infrastruktur ermöglicht sowohl die Suche nach einzelnen Lexemen als auch eine nach Häufigkeit geordnete Suche zu Wortarten oder Lehnwörtern. Die Texte sind auch direkt mit dem elektronischen Wörterbuch verlinkt, in welches neben den im Korpus vorkommenden Wörtern systematisch alle Lexeme aus der bisher wichtigsten grammatikalischen Studie zu Tunis aufgenommen wurden. Das Wörterbuch enthält derzeit fast 8.500 Einträge und ist damit wohl das weltweit umfangreichste online zugängliche Wörterbuch zu einem arabischen Dialekt. Es soll auch in Zukunft weitergeführt werden.Einer der innovativen Ansätze des Projekts lag darin, dass es linguistische Forschung im Bereich der Arabistik mit moderner Texttechnologie verknüpfte und dadurch neue Perspektiven eröffnete. Daten und Dokumentation wurden in derzeit gültigen Standards (TEI) erzeugt und sind daher in hohem Maße dazu angetan, in bestehenden und zukünftigen Projekten in unterschiedlichen Bereichen der linguistischen Forschung und auf dem weiteren Gebiet der Digital Humanities Wiederverwendung zu finden. Das TUNICO-Projekt erzielte beachtliche Fortschritte im Bereich von technischer Infrastruktur für forschungsorientierte Lexikographie. Sämtliche der im Laufe des Projekts entwickelten Komponenten sind frei erhältlich und stehen daher auch zukünftigen Projekten zur Verfügung.
- Veronika Ritt-Benmimoun, Universität Wien , nationale:r Kooperationspartner:in
- Karlheinz Mörth, Österreichische Akademie der Wissenschaften , assoziierte:r Forschungspartner:in
- Martine Vanhove, Centre National de la Recherche Scientifique - Frankreich
- Giuliano Mion, Universitá degli Studi "G.D. Annunzio" - Italien
Research Output
- 9 Publikationen
-
2016
Titel Overabundance in the Arabic Dialect of Tunis: A Diachronic Study of Plural Formation. Typ Conference Proceeding Abstract Autor Dallaji I Konferenz Grigore, George & Bituna, Gabriel: Arabic Varieties: Far and Wide. Proceedings of the 11th Conference of AIDA - Bucharest, 2015. Bucharest: Editura Universitaii din Bucuresti -
2014
Titel Laying the Foundations for a Diachronic Dictionary of Tunis Arabic. A First Glance at an Evolving New Language Resource. Typ Conference Proceeding Abstract Autor Dallaji I Et Al Konferenz Abel, Andrea; Vettori, Chiara; Ralli, Natascia (eds.): Proceedings of the XVI EURALEX International Congress: The User in Focus, Bolzano/Bozen, 15-19 July 2014. Bozen: EURAC Research -
2015
Titel Towards a Diatopic Dictionary of Spoken Arabic Varieties: Challenges in Compiling the VICAV Dictionaries. Typ Conference Proceeding Abstract Autor Moerth Kh Konferenz Grigore, George & Bituna, Gabriel: Arabic Varieties: Far and Wide. Proceedings of the 11th Conference of AIDA - Bucharest, 2015. Bucharest: Editura Universitatii din Bucuresti -
0
Titel Forms and Functions of Diminutives in Tunis Arabic (see AIDA 12). Typ Other Autor Dallaji I -
0
Titel Interrogation in Tunis Arabic: The syntax of yes/no questions. Typ Other Autor Dallaji I -
0
Titel Conditional clauses in Tunis Arabic. Typ Other Autor Dallaji I -
0
Titel A Corpus of Tunis Arabic. Compiled by Ines Dallaji and Ines Gabsi. Typ Other Autor Dallaji I -
0
Titel A Digital Dictionary of Tunis Arabic. Compiled by Ines , Ines Gabsi, Ines, Stephan Prochazka and Veronika. Typ Other Autor Dallaji I -
0
Titel Linguistic Dynamics in Tunis - A first Approach. Typ Other Autor Dallaji I