Aufgabenbeispiele von Tests

Durch Aktualisieren des Browsers (z.B. mit Taste F5) kann man neue Beispielaufgaben sehen


Hypothesen-Test linksseitig

Beispiel:

Eine Pharmafirma behauptet, dass durch eine Verbesserung der Rezeptur die Nebenwirkungen eines Medikaments unter p=0,15 gesunken ist. Um dies nachzuweisen, soll ein 66-stufiger Test mit einer maximalen Irrtumswahrscheinlichkeit von 0,1% durchgeführt werden. In welchem Intervall muss hierfür die Anzahl der Nebenwirkungen liegen? Wie hoch ist die Irrtumswahrscheinlichkeit?

Lösung einblenden
kP(X≤k)
00
10.0003
20.0017
30.0073
40.0226
50.0562
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 0.15 zu verwerfen. Der Test soll bestätigen, dass p<0.15 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 0.1% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(66,0.15,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 1 weniger als 0.1% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.15 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.15 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0003 =0.03% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;1]

Nicht-Ablehnungsbereich von H0: [2;66]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;1], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [2;66], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test rechtseitig

Beispiel:

An einem Roulettetisch fällt die Kugel auffallend oft auf die (so selten gesetzte) grüne Null. Ein spielsüchtiger 12-Klässler bezweifelt deswegen, dass diese tatsächlich die angegebene Wahrscheinlichkeit von p=1/37 hat. Dazu macht er einen Signifikanztest mit 65 Würfen und einem Signifikanzniveau von 5%. In welchem Bereich muss die Häufigkeit der grünen Null liegen, damit er nachweisen kann, dass deren tatsächliche Wahrscheinlichkeit über 1/37 liegt. Wie hoch ist dann die Irrtumswahrscheinlichkeit?

Lösung einblenden
kP(X≤k)
00.1685
10.4727
20.7431
30.9008
40.9687
50.9917
60.9981
70.9996
80.9999
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ 1 37 zu verwerfen. Der Test soll bestätigen, dass p> 1 37 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.05= 0.95 Wahrscheinlichkeit auf sich vereinen muss.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(65, 1 37 ,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 4 erstmals mindestens 95% der Gesamt-Wahrscheinlichkeit ausmachen.

Nicht-Ablehnungsbereich von H0: [0;4]

Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 5 Treffern beginnt.

Ablehnungsbereich von H0: [5;65]

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p= 1 37 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p> 1 37 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0313 =3.13% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [5;65], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;4], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test rechtseitig

Beispiel:

Einem partystarken 12-Klässler wird von einem nicht ganz vorurteilsfreien Lehrer vorgeworfen, nichts auf die Klassenarbeit gelernt haben. Diese findet in Form eines Multiple Choice-Tests mit 65 Aufgaben statt, bei der genau eine der vier Antwortmöglichkeiten richtig ist. In welchem Bereich muss nun die Anzahl der richtigen Antworten liegen, damit er auf einem Signifikanzniveau von 5% die Behauptung des Lehrers widerlegen kann.

Lösung einblenden
kP(X≤k)
......
170.6475
180.7448
190.825
200.8865
210.9305
220.9598
230.978
240.9887
250.9945
260.9975
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ 0.25 zu verwerfen. Der Test soll bestätigen, dass p>0.25 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.05= 0.95 Wahrscheinlichkeit auf sich vereinen muss.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(65,0.25,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 22 erstmals mindestens 95% der Gesamt-Wahrscheinlichkeit ausmachen.

Nicht-Ablehnungsbereich von H0: [0;22]

Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 23 Treffern beginnt.

Ablehnungsbereich von H0: [23;65]

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.25 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.25 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0402 =4.02% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [23;65], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;22], so muss die Nullhypothese beibehalten werden.

2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Fehler 2. Art

Beispiel:

Ein spielsüchtiger 12-Klässler möchte nachweisen, dass ein bestimmter Würfel gezinkt ist und zu selten eine 6 kommt. Dazu macht er einen Signifikanztest mit 55 Würfen und einem Signifikanzniveau von 1%. a) In welchem Bereich muss die Anzahl der 6er liegen, damit er die Spielbank verklagen kann. b) In Wirklichkeit ist der Würfel tatsächlich manipuliert und würfelt nur mit der Wahrscheinlichkeit von 10% eine sechs. Wie groß ist nun die Wahrscheinlichkeit, dass bei dem Test trotzdem die Anzahl der Sechsen nicht in den Ablehnungsbereich gefallen ist und somit - irrtümlicherweise - die falsche Nullhypothese nicht verworfen wurde?

Lösung einblenden
kP(X≤k)
00
10.0005
20.0032
30.0124
40.0365
50.0857
60.1676
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 1 6 zu verwerfen. Der Test soll bestätigen, dass p< 1 6 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 1% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(55, 1 6 ,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 2 weniger als 1% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p= 1 6 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p< 1 6 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0032 =0.32% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;2]

Nicht-Ablehnungsbereich von H0: [3;55]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;2], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [3;55], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

In dieser Aufgabe ist ja aber H0:p= 1 6 falsch, weil ja in Wirklichkeit p=0.1 ist.

Gesucht ist nun die Wahrscheinlichkeit, dass bei dem Test die Trefferanzahl nicht in den Ablehnungsbereich gefallen ist, sondern in den Bereich von 3 bis 55, so dass H0 (irrtümlicherweise) nicht verworfen wurde.

Diese Wahrscheinlichkeit (mit dem richtigen p=0.1) beträgt nun: P0.155 (X3) =1- P0.155 (X2) ≈ 1-0.0774 ≈ 0.9226

Mit 92.26% Wahrscheinlichkeit landet also das Ergebnis des Test im Nicht-Ablehnungsbereich (im Histogramm oben: blauer Bereich), so dass die falsche Nullhypothese nicht verworfen wird.

Fehler 1. Art beurteilen

Beispiel:

Ein Casino hat ein Glücksrad, bei dem die Gewinnwahrscheinlichkeit für den Hauptgewinn mit 10% angegeben wird. Spielgäste haben sich beschwert, weil sie glauben, dass diese Gewinnwahrscheinlichkeit in Wirklichkeit kleiner wäre. Deswegen führt das Casino einen Hypothesentest mit 800 Drehungen dieses Glücksrads durch. Dabei soll das Risiko auf 20% begrenzt werden, dass aufgrund des Tests das Glückrad unnötigerweise ausgetauscht wird, obwohl die Gewinnwahrscheinlichkeit nicht kleiner als 10% ist.

Entscheide dich, welche der angebotenen Nullhypothesen für diesen Test verwendet werden muss.

Lösung einblenden

Wir betrachten jede der 4 möglichen Nullhypothesen im Detail:

1. Die Gewinnwahrscheinlichkeit des Glücksrad beträgt mindestens 20%

error

Die Nullhypothese H0: " ... mindestens 20%", also p ≥ 0.2 macht keinen Sinn, weil die 20%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=10% gehen, also die Gewinnwahrscheinlichkeit dieses Glücksrad.

2. Die Gewinnwahrscheinlichkeit des Glücksrad beträgt höchstens 10%

error

Wenn die Nullhypothese H0: " ... höchstens 10%", also p ≤ 0.1 lautet, soll ja der Test "bestätigen", dass p > 0.1 ist - also ist es ein rechtseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im rechten (orangen) Ablehnungesbreich kleiner als das Signifikanzniveau α = 20% sein muss, falls die Nullhypothese H0: p ≤ 0.1 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≤ 0.1 abzulehnen, obwohl es stimmt, ist somit kleiner als 20%

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≤ 0.1 irrtümlicherweise abzulehnen, damit p > 0.1 anzunehmen (obwohl dies falsch ist), und somit das Glücksrad nicht auszutauschen und Ärger mit der Glückspielbehörde zu riskieren, auf unter 20% begrenzt werden könnte.

Mit dieser Nullhypothese würde man also ein anderes Risiko absichern, als das im Aufgabentext geforderte.

56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101

3. Die Gewinnwahrscheinlichkeit des Glücksrad beträgt höchstens 20%

error

Die Nullhypothese H0: " ... höchstens 20%", also p ≤ 0.2 macht keinen Sinn, weil die 20%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=10% gehen, also die Gewinnwahrscheinlichkeit dieses Glücksrad.

4. Die Gewinnwahrscheinlichkeit des Glücksrad beträgt mindestens 10%

ok

Wenn die Nullhypothese H0: " ... mindestens 10%", also p ≥ 0.1 lautet, soll ja der Test "bestätigen", dass p < 0.1 ist - also ist es ein linksseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im linken (orangen) Ablehnungesbreich kleiner als das Signifikanzniveau α = 20% sein muss, falls die Nullhypothese H0: p ≥ 0.1 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≥ 0.1 abzulehnen, obwohl es stimmt, ist somit kleiner als 20%.

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≥ 0.1 irrtümlicherweise abzulehnen, damit p < 0.1 anzunehmen (obwohl dies falsch ist), und somit das Glücksrad unnötigerweise auszutauschen, auf unter 20% begrenzt werden könnte.

Mit dieser Nullhypothese kann also ein Test die gegebenen Vorgaben erfüllen.

58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103

zweiseitiger Test

Beispiel:

Ein Roulettetisch scheint ungleichmäßig zu laufen. Ein Spieler bezweifelt deswegen, dass die vorgegebene Wahrscheinlichkeit der grünen Null von p= 1 37 wirklich stimmt. Diese Vermutung soll durch einen zweiseitigen Test mit 240 Drehungen des Roulettes untermauert werden. Die maximale Irrtumswahrscheinlichkeit α soll dabei 5% betragen.
In welchen Bereichen muss die Häufigkeit der grünen Null bei der Stichprobe liegen, um die Nullhypothese p= 1 37 statistisch untermauert ablehnen zu können? Wie groß ist in diesem Fall die Irrtumswahrscheinlichkeit?

Lösung einblenden
kP(X≤k)
00.0014
10.0107
20.0415
30.1095
40.2214
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p = 1 37 zu verwerfen. Der Test soll bestätigen, dass p< 1 37 oder p> 1 37 ist, es ist ein zweiseitiger Hypothesentest.

Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken und auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieser beiden Bereiche gerade noch kleiner als das Signifikanzniveau 5% ist.

Dazu teilen wir das Signifikanzniveau 5% gerecht auf 2.5% auf der linken und 2.5% auf der rechten Seite.

Linke Seite:

Schaut man dazu die kumulierte Binomialverteilung an (TI: binomcdf mit n=240 und p= 1 37 ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 1 gerade noch weniger als 2.5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Damit haben wir den linken Teil des Ablehnungsbereichs

kP(X≤k)
......
100.9366
110.9686
120.9855
130.9938
140.9975
......

Rechte Seite:

Auch am rechten Rand darf der Ablehnungsbereich höchstens 2.5% Gesamtwahrscheinlikeit auf sich vereinen, das bedeutet, dass der gesamte Bereich links vom rechten Ablehnungsbereich mindestens 1 - 0.025 = 0.975 als Wahrscheinlichkeit haben muss.

In der Tabelle links erkennt man, dass bei k=12 erstmals P 1 37 240 (Xk) ≥ 0.975 ist (links in der Tabelle in blau dargestellt). Das bedeutet, dass das Intervall von 13 bis 240 das größte ist, das am rechten Rand eine Gesamtwahrscheinlichkeit von unter 2.5% hat.

Der Ablehnungsbereich auf der rechten Seite ist somit von 13 bis 240.

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in eines dieser beiden Intervalle, so wäre das bei Gültigkeit der Nullhypothese H0: p= 1 37 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p≠ 1 37 als statistisch abgesichert betrachten darf.

Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von P 1 37 240 (X1) = 0.0107 auf der linken Seite und P 1 37 240 (X13) = 1-0.9855 = 0.0145 auf der rechten Seite.
Insgesamt ist somit die Irrtumswahrscheinlichkeit PIrr = 0.0107 + 0.0145 = 0.0252 =2.52% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;1] und [13;240]

Nicht-Ablehnungsbereich von H0: [2;12]

Entscheidungsregel: Fällt die Anzahl der Treffer in einen der Ablehnungsbereiche von H0: [0;1] oder [13;240], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [2;12], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)