Abweichungen vom rein statistischen Verfahren

Aus Variantengrammatik des Standarddeutschen
Wechseln zu:Navigation, Suche

Es ist erklärtes Ziel der Variantengrammatik des Standarddeutschen, ein Nachschlagewerk zu präsentieren, das auf korpuslinguistischer Methodik beruht und streng empirisch fundiert ist. Um dem gerecht zu werden, haben wir einen Arbeitsablauf zur Erstellung eines Artikels entworfen, in dessen Zentrum ein statistisches Verfahren zur Ermittlung von Signifikanz beobachteter linguistischer Phänomenverteilungen steht (s. Arbeitsablauf beim Verfassen von Artikeln).

Der Chi-Quadrat-Test ist – wie auch andere Signifikanztests – ein Verfahren, das verhindern soll, dass empirisch ermittelte Unterschiede der Auftretenshäufigkeiten eines Phänomens als relevant erachtet werden, obwohl es sich de facto um zufällige Differenzen handelt. Der Test dient also als Absicherung gegen Zufallsbefunde. Er liefert zu dem Zweck eine Wahrscheinlichkeit für das zufällige Auftreten der beobachteten Häufigkeitsverteilung. Je geringer die Wahrscheinlichkeit, desto plausibler ist die Annahme, dass die Beobachtung nicht dem Zufall, sondern anderen – im vorliegenden Fall variationsbedingten – Gründen geschuldet ist. Damit der Test verlässlich eine Zufallswahrscheinlichkeit liefern kann, ist eine ausreichend große Stichprobe nötig. Insbesondere für den Chi-Quadrat-Test gilt es als Mindestanforderung, dass sowohl die beobachteten als auch die errechneten zu erwartenden Häufigkeiten alle mindestens eine Größe von 5 haben. Eine etwas moderatere Anforderung verlangt, dass 80% der Häufigkeiten den Wert von mindestens 5 aufweisen müssen. Hat eine der beobachteten Häufigkeiten einen Wert von 0, ist der Test überhaupt nicht anwendbar.

Genau dieser Fall tritt aber mitunter bei einigen Zählungen auf, die auf der Basis des Korpus ermittelt wurden. Verschärft wird diese Situation dadurch, dass die vorhandene Stichprobe für manche Areale wesentlich geringer ist als für andere (s. Korpusgrößen). Es gibt Varianten, die derart eindeutig areal definiert sind, dass sie in anderen Arealen überhaupt nicht vorkommen. Dabei handelt es sich zum Teil um solche, die von lokalen Sprechteilnehmenden zweifelsfrei als solche identifiziert werden können.

Andererseits gibt es natürlich auch Fälle, bei denen der Test rechnerisch anwendbar ist, die oben beschriebenen Mindestanforderungen aber nicht erfüllt sind. In beiden Fällen obliegt es letztlich der Expertise der Forschenden, zu entscheiden, ob ein Eintrag gerechtfertigt ist oder nicht. So ist in der strukturellen Anlage des Projektes mitgedacht, dass die methodische Ausrichtung der Variantengrammatik in solchen Fällen nicht komplett zu Gunsten einer linguistischen Einzelsprecherintuition aufgegeben werden muss. In zweierlei Hinsicht wurde dem Rechnung getragen: einerseits dadurch, dass es sich um ein trinationales Projekt handelt, dessen Mitglieder aus unterschiedlichen Arealen stammen. Andererseits dadurch, dass jede Person einen linguistischen Phänomenbereich in voller Breite abdeckt, so dass sie in der Lage ist, die Zahlen, die Korpusabfragen und die statistischen Auswertungen jeweils mit Blick auf das Gesamtbild der gefundenen Ergebnisse auszuwerten und zu interpretieren. In Grenz- und Zweifelsfällen konnten so Expertengremien gebildet werden, die im Konsens darüber entschieden haben, ob ein Befund als Variante zu behandeln ist oder nicht. Flankierend wurden in dieser Situation, soweit sinnvoll, weitere statistische Tests (t-Test, Fischer-Exakt-Test) durchgeführt. Solche Entscheidungen stellen aber Ausnahmefälle dar, in den allermeisten Fällen konnte das testbasierte Verfahren ohne Abweichungen angewendet werden.

Allerdings wäre es wünschenswert, wenn man auch in solchen Fällen ein dezidiert empirisches Programm verfolgen könnte. Dies stellt in der Korpuslinguistik noch ein Desiderat dar. So müssten Werkzeuge entwickelt werden, die ein sehr viel interaktiveres Operieren mit den Daten erlauben, es also beispielsweise ermöglichen, variabel und live Korpora zu definieren, oder einen stichprobengerechten Signifikanztest auszuwählen. Ohne die dafür notwendige technische Unterstützung stößt man hier aber sehr schnell an zeit- und ressourcenbedingte Grenzen.