Hypothesentests führt man immer dann durch, wenn man irgendetwas mit Hilfe von erhobenen Daten nachweisen möchte, zum Beispiel dass auf dem Oktoberfest die Maßkrüge nicht ganz vollgemacht werden. Der Grundsatz bei allen statistischen Tests ist hierbei, dass wir das Gegenteil widerlegen müssen - wir müssen also widerlegen, dass der Maßkrug tatsächlich mit einem Liter gefüllt ist.
Um den Grund für dieses Vorgehen zu verstehen, kann man sich eine Gerichtsverhandlung vorstellen, und Parallelen zum Ablauf eines Tests ziehen: Man geht davon aus, dass der Angeklagte unschuldig ist (ohne es genau zu wissen). Bevor man von der Schuld des Angeklagten überzeugt sein kann, muss man ausreichend Beweise gesammelt haben, um zweifelsfrei an die Schuldigkeit glauben zu können. Falls das nicht der Fall ist, muss man davon ausgehen, dass er unschuldig ist. Man könnte diesen Sachverhalt in statistischen Hypothesen formulieren:
: Der Angeklagte ist unschuldig
: Der Angeklagte ist schuldig
Wie läuft ein Test ab?
Zuallererst formuliert man seine Fragestellung in ein Hypothesenpaar um, und zwar eine Nullhypothese und eine Alternativhypothese. Man geht davon aus, dass die Nullhypothese gilt, außer man findet durch die Daten einen starken Hinweis, dass stattdessen die Alternativhypothese wahr ist.
Dann sammelt man Daten, und berechnet aus ihnen eine Prüfgröße, auch Teststatistik genannt. Das ist beim klassischen Gaußtest zum Beispiel der Mittelwert der Daten (der mit einigen wenigen Faktoren standardisiert wird). Bei vielen anderen Tests ist die Berechnung der Teststatistik allerdings aufwändiger.
Ein Test ist nun nichts weiteres als eine mathematische Regel, um zu entscheiden, ob diese Teststatistik eher auf die Null- oder die Alternativhypothese schließen lässt. Bei der einfachsten Variante bestimmt man einfach einen kritischen Wert, also eine Schranke für die Teststatistik. Wenn der Wert über dieser Schranke liegt, haben wir einen Nachweis gefunden, dass die Alternativhypothese stimmt. Wenn der Wert der Teststatistik aber unter dieser kritischen Schranke liegt, können wir keine sichere Aussage treffen.
Welche Arten von Tests gibt es?
Die klassischen Tests behandeln Mittelwerte. Sie fragen also, ob der Mittelwert eines gemessenen Merkmals größer (oder kleiner) als ein bestimmter, für uns wichtiger, Wert ist. Das wäre bei dem Maßkrug der Fall, wo wir wissen wollen ob der Inhalt des Kruges gleich einem Liter ist, oder ob weniger als ein Liter abgefüllt wird.
Andere Tests überprüfen, ob sich zwei Merkmale gegenseitig beeinflussen, oder ob sie unabhängig sind. Zum Beispiel könnte man sich dafür interessieren, ob bei einer Wahl Männer und Frauen ein unterschiedliches Wahlverhalten haben. Dann würde man testen, ob die Variable "Geschlecht" und die Variable "gewählte Partei" voneinander unabhängig sind.
Als letztes Beispiel sei die Regression genannt, in der wir Regressionsparameter (die meist genannt werden) erhalten, die uns den Einfluss einer Variablen auf eine andere beschreiben. Hier möchte man testen, ob der Wert von
ungleich 0 ist, was nämlich belegt, dass ein Einfluss vorhanden ist.