Aufgabenbeispiele von Tests
Durch Aktualisieren des Browsers (z.B. mit Taste F5) kann man neue Beispielaufgaben sehen
Hypothesen-Test linksseitig
Beispiel:
Zlatan Ibrahimovic behauptet von sich, dass er mit mindestens 70% Wahrscheinlichkeit von der Strafraumgrenze die Querlatte des Tores treffe. Obwohl Ibrahimovic für seine geradezu legendäre Bescheidenheit und Demut bekannt ist, zweifelt ein Mitspieler an dieser Quote. Sie einigen sich auf einen Test mit 57 Versuchen und einem Signifikanzniveau von 5% (was auch immer Ibrahimovic darunter verstehen mag). In welchem Bereich muss die Anzahl der Lattentreffer liegen um den schwedischen Stürmer der Prahlerei zu überführen?
| k | P(X≤k) | 
|---|---|
| ... | ... | 
| 28 | 0.0008 | 
| 29 | 0.0019 | 
| 30 | 0.0043 | 
| 31 | 0.0092 | 
| 32 | 0.0185 | 
| 33 | 0.0349 | 
| 34 | 0.062 | 
| 35 | 0.1034 | 
| 36 | 0.1626 | 
| 37 | 0.2409 | 
| ... | ... | 
Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 0.7 zu verwerfen. Der Test soll bestätigen, dass p<0.7 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.
Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(57,0.7,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 33 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.7 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.7 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0349 =3.49% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)
Ablehnungsbereich von H0: [0;33]
Nicht-Ablehnungsbereich von H0: [34;57]
Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;33], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [34;57], so muss die Nullhypothese beibehalten werden.
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)
Hypothesen-Test rechtseitig
Beispiel:
An einem Roulettetisch fällt die Kugel auffallend oft auf die (so selten gesetzte) grüne Null. Ein spielsüchtiger 12-Klässler bezweifelt deswegen, dass diese tatsächlich die angegebene Wahrscheinlichkeit von p=1/37 hat. Dazu macht er einen Signifikanztest mit 80 Würfen und einem Signifikanzniveau von 0,1%. In welchem Bereich muss die Häufigkeit der grünen Null liegen, damit er nachweisen kann, dass deren tatsächliche Wahrscheinlichkeit über 1/37 liegt. Wie hoch ist dann die Irrtumswahrscheinlichkeit?
| k | P(X≤k) | 
|---|---|
| ... | ... | 
| 3 | 0.829 | 
| 4 | 0.9342 | 
| 5 | 0.9786 | 
| 6 | 0.994 | 
| 7 | 0.9985 | 
| 8 | 0.9997 | 
| 9 | 0.9999 | 
| 10 | 1 | 
| 11 | 1 | 
| 12 | 1 | 
| ... | ... | 
Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ zu verwerfen. Der Test soll bestätigen, dass p> ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 0.1% ist.
Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.001= 0.999 Wahrscheinlichkeit auf sich vereinen muss.
Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(80,,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 8 erstmals mindestens 99.9% der Gesamt-Wahrscheinlichkeit ausmachen.
Nicht-Ablehnungsbereich von H0: [0;8]
Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 9 Treffern beginnt.
Ablehnungsbereich von H0: [9;80]
Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p= so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p> als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0003 =0.03% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)
Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [9;80], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;8], so muss die Nullhypothese beibehalten werden.
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)
Hypothesen-Test rechtseitig
Beispiel:
Die Kursstufenschüler Maxi und Noah verbringen ihr Pausen leidenschaftlich gerne mit einem Bäckertüten-Mülleimer-Contest. Dabei geht es darum, eine zusammengeknüllte Bäckertüte in den an der entferntesten Ecke stehenden Mülleimer zu treffen. Der interessiert zuschauende Mathelehrer rät ihnen doch etwas näher an den Mülleimer ran zu gehen, weil sie eh höchstens jedes zehnte mal treffen. Empfindlich in ihre Macho-Ehre verletzt, beschließen sie darauf hin ein Test mit 63 Würfen durchzuführen, der die absurd niedrige vom Lehrer behauptete Trefferquote auf einem Signifikanzniveau von 5% widerlegen soll. In welchem Bereich müsste die Trefferzahl liegen, um über den Mathelehrer zu triumphieren zu können?
| k | P(X≤k) | 
|---|---|
| ... | ... | 
| 5 | 0.3883 | 
| 6 | 0.5558 | 
| 7 | 0.7073 | 
| 8 | 0.8252 | 
| 9 | 0.9052 | 
| 10 | 0.9532 | 
| 11 | 0.9789 | 
| 12 | 0.9913 | 
| 13 | 0.9967 | 
| 14 | 0.9989 | 
| ... | ... | 
Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ 0.1 zu verwerfen. Der Test soll bestätigen, dass p>0.1 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.
Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.05= 0.95 Wahrscheinlichkeit auf sich vereinen muss.
Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(63,0.1,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 10 erstmals mindestens 95% der Gesamt-Wahrscheinlichkeit ausmachen.
Nicht-Ablehnungsbereich von H0: [0;10]
Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 11 Treffern beginnt.
Ablehnungsbereich von H0: [11;63]
Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.1 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.1 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0468 =4.68% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)
Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [11;63], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;10], so muss die Nullhypothese beibehalten werden.
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)
Fehler 2. Art
Beispiel:
Ein Großhändler beklagt sich, dass gelieferte LED-Leuchtmittel mit einer Wahrscheinlichkeit von p=0,29 bereits nach wenigen Stunden defekt werden. Die herstellende Firma glaubt das nicht und hält die Ausschussquote für viel geringer. Deswegen führt sie einen Test mit 57 Leuchtmitteln durch. Als Signifikanzniveau für diesen Test wird 5% festgelegt. a) In welchem Bereich muss die Anzahl der defekten LED-Leuchtmittel liegen, damit die Firma die Aussage des Großhändlers widerlegt? b) In Wirklichkeit liegt die Ausfallwahrscheinlickeit der Leuchtmittel nur bei p=0,14. Wie groß ist nun die Wahrscheinlichkeit, dass bei dem Test trotzdem die Anzahl der defekten Leuchtmittel nicht in den Ablehnungsbereich gefallen ist und somit - irrtümlicherweise - die falsche Nullhypothese nicht verworfen wurde?
| k | P(X≤k) | 
|---|---|
| ... | ... | 
| 5 | 0.0002 | 
| 6 | 0.0008 | 
| 7 | 0.0024 | 
| 8 | 0.0067 | 
| 9 | 0.0161 | 
| 10 | 0.0347 | 
| 11 | 0.0671 | 
| 12 | 0.1178 | 
| 13 | 0.1895 | 
| 14 | 0.2815 | 
| ... | ... | 
Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 0.29 zu verwerfen. Der Test soll bestätigen, dass p<0.29 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.
Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(57,0.29,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 10 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.29 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.29 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0347 =3.47% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)
Ablehnungsbereich von H0: [0;10]
Nicht-Ablehnungsbereich von H0: [11;57]
Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;10], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [11;57], so muss die Nullhypothese beibehalten werden.
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)
In dieser Aufgabe ist ja aber H0:p=0.29 falsch, weil ja in Wirklichkeit p=0.14 ist.
Gesucht ist nun die Wahrscheinlichkeit, dass bei dem Test die Trefferanzahl nicht in den Ablehnungsbereich gefallen ist, sondern in den Bereich von 11 bis 57, so dass H0 (irrtümlicherweise) nicht verworfen wurde.
Diese Wahrscheinlichkeit (mit dem richtigen p=0.14) beträgt nun: =1- ≈ 1-0.8335 ≈ 0.1665
Mit 16.65% Wahrscheinlichkeit landet also das Ergebnis des Test im Nicht-Ablehnungsbereich (im Histogramm oben: blauer Bereich), so dass die falsche Nullhypothese nicht verworfen wird.
Fehler 1. Art beurteilen
Beispiel:
Eine Firma möchte den Preis für ihr umsatzstärkstes Produkt erhöhen. Die Marketingabteilung geht davon aus, dass dadurch 12% der Kunden zu einem Mitbewerberprodukt wechseln und somit der Umsatz so stark zurückgehen würde, dass sich die Preiserhöhung gar nicht lohnt. Die Geschäftsführung ist sich aber nicht ganz sicher, ob diese Zahl verlässlich ist und beschließt, einen Hypothesentest mit 700 Personen durchzuführen, die befragt werden, ob sie bei der Preiserhöhung zu einem anderen Produkt wechseln würden. Dabei möchte sie das Risiko auf 10% begrenzen, dass aufgrund des Tests irrtümlicherweise die Preiserhöhung vollzogen wird und somit ein starker Umsatzeinbruch eintritt.
Entscheide dich, welche der angebotenen Nullhypothesen für diesen Test verwendet werden muss.
Wir betrachten jede der 4 möglichen Nullhypothesen im Detail:
1. Der Anteil der Kunden, die zu einem Mitbewerberprodukt wechseln, beträgt mindestens 12%
 
				Wenn die Nullhypothese H0: " ... mindestens 12%", also p ≥ 0.12 lautet, soll ja der Test "bestätigen", dass p < 0.12 ist - also ist es ein linksseitiger Hypothesentest.
Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im linken (orangen) Ablehnungesbreich kleiner als das Signifikanzniveau α = 10% sein muss, falls die Nullhypothese H0: p ≥ 0.12 doch stimmen sollte.
Die Wahrscheinlichkeit, p ≥ 0.12 abzulehnen, obwohl es stimmt, ist somit kleiner als 10%.
In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≥ 0.12 irrtümlicherweise abzulehnen, damit p < 0.12 anzunehmen (obwohl dies falsch ist), und somit die Preiserhöhung durchzuführen und einen Umsatzeinbruch zu riskieren, auf unter 10% begrenzt werden könnte.
Mit dieser Nullhypothese kann also ein Test die gegebenen Vorgaben erfüllen.
2. Der Anteil der Kunden, die zu einem Mitbewerberprodukt wechseln, beträgt mindestens 10%
 
				Die Nullhypothese H0: " ... mindestens 10%", also p ≥ 0.1 macht keinen Sinn, weil die 10%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.
In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=12% gehen, also wieviel Prozent bei einer Preiserhöhung zu einem Mitbewerberprodukt wechseln.
3. Der Anteil der Kunden, die zu einem Mitbewerberprodukt wechseln, beträgt höchstens 10%
 
				Die Nullhypothese H0: " ... höchstens 10%", also p ≤ 0.1 macht keinen Sinn, weil die 10%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.
In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=12% gehen, also wieviel Prozent bei einer Preiserhöhung zu einem Mitbewerberprodukt wechseln.
4. Der Anteil der Kunden, die zu einem Mitbewerberprodukt wechseln, beträgt höchstens 12%
 
				Wenn die Nullhypothese H0: " ... höchstens 12%", also p ≤ 0.12 lautet, soll ja der Test "bestätigen", dass p > 0.12 ist - also ist es ein rechtseitiger Hypothesentest.
Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im rechten (orangen) Ablehnungesbreich kleiner als das Signifikanzniveau α = 10% sein muss, falls die Nullhypothese H0: p ≤ 0.12 doch stimmen sollte.
Die Wahrscheinlichkeit, p ≤ 0.12 abzulehnen, obwohl es stimmt, ist somit kleiner als 10%
In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≤ 0.12 irrtümlicherweise abzulehnen, damit p > 0.12 anzunehmen (obwohl dies falsch ist), und somit auf die Preiserhöhung zu verzichten (obwohl diese sinnvoll wäre), auf unter 10% begrenzt werden könnte.
Mit dieser Nullhypothese würde man also ein anderes Risiko absichern, als das im Aufgabentext geforderte.
zweiseitiger Test
Beispiel:
Durch einen Test soll statistisch untermauert werden, dass eine bestimmte Wahrscheinlichkeit p≠0,9 ist. Dazu soll die Nullhypothese H0: p=0,9 mit einer zufälligen Stichprobe (praktisch als Zufallsexperiment) der Größe n=53 verworfen werden. Die maximale Irrtumswahrscheinlichkeit α soll dabei 1% betragen. In welchen Bereichen muss die Anzahl der Treffer bei der Stichprobe liegen, um die Nullhypothese p=0,9 statistisch untermauert ablehnen zu können? Wie groß ist in diesem Fall die Irrtumswahrscheinlichkeit?
| k | P(X≤k) | 
|---|---|
| ... | ... | 
| 39 | 0.0005 | 
| 40 | 0.0018 | 
| 41 | 0.0053 | 
| 42 | 0.0145 | 
| 43 | 0.0355 | 
| ... | ... | 
Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p = 0.9 zu verwerfen. Der Test soll bestätigen, dass p<0.9 oder p>0.9 ist, es ist ein zweiseitiger Hypothesentest.
Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken und auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieser beiden Bereiche gerade noch kleiner als das Signifikanzniveau 1% ist.
Dazu teilen wir das Signifikanzniveau 1% gerecht auf 0.5% auf der linken und 0.5% auf der rechten Seite.
Linke Seite:
Schaut man dazu die kumulierte Binomialverteilung an (TI: binomcdf mit n=53 und p=0.9), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 40 gerade noch weniger als 0.5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Damit haben wir den linken Teil des Ablehnungsbereichs
| k | P(X≤k) | 
|---|---|
| ... | ... | 
| 50 | 0.9102 | 
| 51 | 0.9741 | 
| 52 | 0.9962 | 
| 53 | 1 | 
Rechte Seite:
Auch am rechten Rand darf der Ablehnungsbereich höchstens 0.5% Gesamtwahrscheinlikeit auf sich vereinen, das bedeutet, dass der gesamte Bereich links vom rechten Ablehnungsbereich mindestens 1 - 0.005 = 0.995 als Wahrscheinlichkeit haben muss.
In der Tabelle links erkennt man, dass bei k=52 erstmals ≥ 0.995 ist (links in der Tabelle in blau dargestellt). Das bedeutet, dass das Intervall von 53 bis 53 das größte ist, das am rechten Rand eine Gesamtwahrscheinlichkeit von unter 0.5% hat.
Der Ablehnungsbereich auf der rechten Seite ist somit von 53 bis 53.
Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in eines dieser beiden Intervalle, so wäre das bei Gültigkeit der Nullhypothese H0: p=0.9 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p≠0.9 als statistisch abgesichert betrachten darf.
Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 
				 = 
				0.0018 auf der linken Seite und 
				 = 1-0.9962
				= 0.0038 auf der rechten Seite.
Insgesamt ist somit die Irrtumswahrscheinlichkeit 
				PIrr = 0.0018 + 0.0038 = 0.0055
				=0.55% 	(dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)
Ablehnungsbereich von H0: [0;40] und [53;53]
Nicht-Ablehnungsbereich von H0: [41;52]
Entscheidungsregel: Fällt die Anzahl der Treffer in einen der Ablehnungsbereiche von H0: [0;40] oder [53;53], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [41;52], so muss die Nullhypothese beibehalten werden.
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

 
				





