Wortlängen(verteilungen) in slawischen Texten
Word Lenght (Distributions) in Slavic Texts
Wissenschaftsdisziplinen
Andere Geisteswissenschaften (100%)
Keywords
-
WORTLÄNGE,
TEXTWISSENSCHAFT,
TEXTKLASSIFIKATION,
EMPIRISCHER ZUGANG,
INTERDISZIPLINARITÄT
Das Wort ist neben dem `Satz` ein zentrales Element jeglicher Textgestaltung. Ungeachtet dessen ist `Wortlänge` eine in der Theoriebildung der Sprach-, Literatur- und Textwissenschaft über lange Jahre vernachlässigte Eigenschaft. Erst in jüngster Zeit ist die Frage der Vorkommenshäufigkeit von Wortlängen in Texten (einer Sprache, eines Autors, einer Textsorte, usw.) systematisch in theoretische Zusammenhänge gestellt worden, wobei erstmals auch eine eigentliche Theorie der Verteilung von Wortlängenhäufigkeiten in Texten entwickelt worden ist. Bisher vorliegende Ergebnisse zeigen, dass die Häufigkeit, mit der ein-, zwei-, drei-, usw.-silbige Wörter in Texten vorkommen, nicht chaotisch, sondern gesetzmäßig geregelt ist - ein Umstand, der tiefe Einsichten in Struktur und Funktionieren von Texten bietet. Während man früher allerdings ein einheitliches, sprachübergreifendes Gesetz für die Vorkommenshäufigkeiten von Wortlängen in Texten annahm, geht man nunmehr von einem flexiblen System aus, welches übergeordnete Ausgangsmodelle und mögliche Modifikationen durch sprach-, autoren-, textsortenspezifische, zeitliche o.ä. Faktoren vorsieht. Die Frage, wie sich die Vorkommenshäufigkeiten von Wortlängen in slawischen Sprachen theoretisch beschreiben lassen, ist bislang ebensowenig systematisch untersucht worden wie die Frage, wie sich die spezifischen "Randbedingungen" konkret auswirken, und ob die durch diese Einflussfaktoren bedingten Modifikationen einen Beitrag zur Textsortenklassifikation bzw. - diskrimination leisten können. An jeweils ca. 1000 Texten in drei slawischen Spachen (Russisch, Kroatisch, Slowenisch) soll in diesem Forschungsvorhaben diesen Fragen deshalb erstmals systematisch nachgegangen werden. Die zu diesem Zweck anzulegende Text-Datenbank soll mit entsprechenden Meta-Daten organisiert und nach Möglichkeit auch extern nutzbar gemacht werden; dassselbe gilt für speziell zu erstellende Analyse-Software, die prospektiv im Hinblick auf weitere (nicht nur slawische) Sprachen zu konzipieren ist. Die Ergebnisse des Projekts werden nicht nur für den engeren Bereich der slawischen Sprach- und Textwissenschaft von Relevanz sein, sondern auch und gerade (a) theoretischen Einblick in tiefenstruktruelle Gesetzmäßigkeiten der Textorganisation überhaupt ermöglichen sowie (b) Aufschluss über die modifizierende Rolle spezifischer Einflussfaktoren geben. Darüber hinaus ist zu erwarten, dass durch die systematische Untersuchung von Wortlängen und ihren Vorkommenshäufigkeiten (c) ein wichtiger Beitrag zur Textklassifikation und Textsortendiskrimination geleistet werden kann. Aufgrund der sprach-übergreifend zu verstehenden Informationsregularitäten und der bei ihrer Untersuchung notwendigerweise zur Anwendung kommenden statistischen Methoden läßt sich das Projekt als interdisziplinäre Realisierung des immer wieder postulierten Brückenschlags zwischen Kultur- und Naturwissenschaften verstehen.
- Universität Graz - 100%