Projektdetail

Grant-DOI 10.55776/P15485
Bewilligungssumme Einzelprojekte
Status beendet
Projektbeginn 01.04.2002
Projektende 31.03.2005
Bewilligungssumme 162.690 €
Projekt-Website

Wissenschaftsdisziplinen

Andere Geisteswissenschaften (100%)

Keywords

WORTLÄNGE,
TEXTWISSENSCHAFT,
TEXTKLASSIFIKATION,
EMPIRISCHER ZUGANG,
INTERDISZIPLINARITÄT

Abstract

Das Wort ist neben dem `Satz` ein zentrales Element jeglicher Textgestaltung. Ungeachtet dessen ist `Wortlänge` eine in der Theoriebildung der Sprach-, Literatur- und Textwissenschaft über lange Jahre vernachlässigte Eigenschaft. Erst in jüngster Zeit ist die Frage der Vorkommenshäufigkeit von Wortlängen in Texten (einer Sprache, eines Autors, einer Textsorte, usw.) systematisch in theoretische Zusammenhänge gestellt worden, wobei erstmals auch eine eigentliche Theorie der Verteilung von Wortlängenhäufigkeiten in Texten entwickelt worden ist. Bisher vorliegende Ergebnisse zeigen, dass die Häufigkeit, mit der ein-, zwei-, drei-, usw.-silbige Wörter in Texten vorkommen, nicht chaotisch, sondern gesetzmäßig geregelt ist - ein Umstand, der tiefe Einsichten in Struktur und Funktionieren von Texten bietet. Während man früher allerdings ein einheitliches, sprachübergreifendes Gesetz für die Vorkommenshäufigkeiten von Wortlängen in Texten annahm, geht man nunmehr von einem flexiblen System aus, welches übergeordnete Ausgangsmodelle und mögliche Modifikationen durch sprach-, autoren-, textsortenspezifische, zeitliche o.ä. Faktoren vorsieht. Die Frage, wie sich die Vorkommenshäufigkeiten von Wortlängen in slawischen Sprachen theoretisch beschreiben lassen, ist bislang ebensowenig systematisch untersucht worden wie die Frage, wie sich die spezifischen "Randbedingungen" konkret auswirken, und ob die durch diese Einflussfaktoren bedingten Modifikationen einen Beitrag zur Textsortenklassifikation bzw. - diskrimination leisten können. An jeweils ca. 1000 Texten in drei slawischen Spachen (Russisch, Kroatisch, Slowenisch) soll in diesem Forschungsvorhaben diesen Fragen deshalb erstmals systematisch nachgegangen werden. Die zu diesem Zweck anzulegende Text-Datenbank soll mit entsprechenden Meta-Daten organisiert und nach Möglichkeit auch extern nutzbar gemacht werden; dassselbe gilt für speziell zu erstellende Analyse-Software, die prospektiv im Hinblick auf weitere (nicht nur slawische) Sprachen zu konzipieren ist. Die Ergebnisse des Projekts werden nicht nur für den engeren Bereich der slawischen Sprach- und Textwissenschaft von Relevanz sein, sondern auch und gerade (a) theoretischen Einblick in tiefenstruktruelle Gesetzmäßigkeiten der Textorganisation überhaupt ermöglichen sowie (b) Aufschluss über die modifizierende Rolle spezifischer Einflussfaktoren geben. Darüber hinaus ist zu erwarten, dass durch die systematische Untersuchung von Wortlängen und ihren Vorkommenshäufigkeiten (c) ein wichtiger Beitrag zur Textklassifikation und Textsortendiskrimination geleistet werden kann. Aufgrund der sprach-übergreifend zu verstehenden Informationsregularitäten und der bei ihrer Untersuchung notwendigerweise zur Anwendung kommenden statistischen Methoden läßt sich das Projekt als interdisziplinäre Realisierung des immer wieder postulierten Brückenschlags zwischen Kultur- und Naturwissenschaften verstehen.

Forschungsstätte(n)

Universität Graz - 100%

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

Wortlängen(verteilungen) in slawischen Texten

Word Lenght (Distributions) in Slavic Texts

Wissenschaftsdisziplinen

Keywords

Kontakt

Allgemeines

Zur Übersichtsseite Entdecken

Zur Übersichtsseite Fördern

Zur Übersichtsseite Über uns

Zur Übersichtsseite Aktuelles

SOCIAL MEDIA

SCILOG

Wortlängen(verteilungen) in slawischen Texten

Word Lenght (Distributions) in Slavic Texts

Wissenschaftsdisziplinen

Keywords