Pestalozzi Gymnasium Biberach EduRandomtasks

Hypothesen-Test linksseitig

Beispiel:

Ein Basketballspieler behauptet, er habe bei Freiwürfen eine Trefferwahrscheinlichkeit von p=0,75. Sein Trainer glaubt, dass er sich dabei überschätzt. Um das zu überprüfen, muss der Basketballspieler 25 mal werfen. In welchem Intervall müssen die Treffer liegen, dass sich der Trainer auf einem Signifikanzniveau von 5% bestätigt sieht? Wie hoch bleibt dabei die Irrtumswahrscheinlichkeit.

Lösung einblenden

k	P(X≤k)
...	...
9	0
10	0.0002
11	0.0009
12	0.0034
13	0.0107
14	0.0297
15	0.0713
16	0.1494
17	0.2735
18	0.4389
...	...

Dieser Hypothesentest wird gemacht um die Nullhypothese H₀: p ≥ 0.75 zu verwerfen. Der Test soll bestätigen, dass p<0.75 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H₀ auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(25,0.75,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 14 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H₀: p=0.75 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.75 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0297 =2.97% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H₀: [0;14]

Nicht-Ablehnungsbereich von H₀: [15;25]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H₀: [0;14], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H₀: [15;25], so muss die Nullhypothese beibehalten werden.

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test rechtseitig

Beispiel:

In einem Multiple Choice Test ist bei jeder der 90 Aufgaben genau eine von fünf Lösungsmöglichkeiten richtig. In welchem Intervall muss die Anzahl der richtigen Antworten von Kevin liegen, damit er seiner Mutter (mit einer max. Irrtumswahrscheinlichkeit von 5%) nachweisen kann, dass er auf den Test etwas gelernt und dadurch etwas gewusst hat und nicht jede Frage dem Zufall überließ? Gib die Irrtumswahrscheinlichkeit an!

Lösung einblenden

k	P(X≤k)
...	...
19	0.6617
20	0.7497
21	0.823
22	0.8805
23	0.923
24	0.9526
25	0.9722
26	0.9844
27	0.9917
28	0.9957
...	...

Dieser Hypothesentest wird gemacht um die Nullhypothese H₀: p ≤ 0.2 zu verwerfen. Der Test soll bestätigen, dass p>0.2 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H₀ auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Das heißt, dass der Nicht-Ablehnungsbereich von H₀ (hier blau eingefärbt) auf der linken Seite mindestens 1-0.05= 0.95 Wahrscheinlichkeit auf sich vereinen muss.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(90,0.2,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 24 erstmals mindestens 95% der Gesamt-Wahrscheinlichkeit ausmachen.

Nicht-Ablehnungsbereich von H₀: [0;24]

Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H₀ dass dieser erst bei 25 Treffern beginnt.

Ablehnungsbereich von H₀: [25;90]

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H₀: p=0.2 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.2 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0474 =4.74% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H₀: [25;90], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H₀: [0;24], so muss die Nullhypothese beibehalten werden.

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test rechtseitig

Beispiel:

Ein Basketballspieler behauptet, er habe bei Freiwürfen seine bisherige Trefferwahrscheinlichkeit von p=0,5 inzwischen verbessert. Sein Trainer glaubt ihm sich das nicht. Um seine Verbesserung zu überprüfen, muss der Basketballspieler 59 mal werfen. In welchem Intervall müssen die Treffer liegen, damit sich der Spieler auf einem Signifikanzniveau von 1% bestätigt sieht? Wie hoch bleibt dabei die Irrtumswahrscheinlichkeit.

Lösung einblenden

k	P(X≤k)
...	...
33	0.8512
34	0.9037
35	0.9413
36	0.9663
37	0.9818
38	0.9908
39	0.9957
40	0.9981
41	0.9992
42	0.9997
...	...

Dieser Hypothesentest wird gemacht um die Nullhypothese H₀: p ≤ 0.5 zu verwerfen. Der Test soll bestätigen, dass p>0.5 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H₀ auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 1% ist.

Das heißt, dass der Nicht-Ablehnungsbereich von H₀ (hier blau eingefärbt) auf der linken Seite mindestens 1-0.01= 0.99 Wahrscheinlichkeit auf sich vereinen muss.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(59,0.5,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 38 erstmals mindestens 99% der Gesamt-Wahrscheinlichkeit ausmachen.

Nicht-Ablehnungsbereich von H₀: [0;38]

Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H₀ dass dieser erst bei 39 Treffern beginnt.

Ablehnungsbereich von H₀: [39;59]

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H₀: p=0.5 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.5 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0092 =0.92% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H₀: [39;59], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H₀: [0;38], so muss die Nullhypothese beibehalten werden.

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Fehler 2. Art

Beispiel:

Eine Pharmafirma behauptet, dass durch eine Verbesserung der Rezeptur die Nebenwirkungen eines Medikament unter p=0,13 gesunken ist. Um dies nachzuweisen, soll ein 79-stufiger Test mit einer maximalen Irrtumswahrscheinlichkeit von 5% durchgeführt werden. a) In welchem Intervall muss hierfür die Anzahl der Nebenwirkungen liegen? b) In Wirklichkeit liegt die Wahrscheinlickeit für Nebenwirkungen bei p=0,08. Wie groß ist nun die Wahrscheinlichkeit, dass bei dem Test trotzdem die Anzahl der Nebenwirkungen nicht in den Ablehnungsbereich gefallen ist und somit - irrtümlicherweise - die falsche Nullhypothese nicht verworfen wurde?

Lösung einblenden

k	P(X≤k)
0	0
1	0.0002
2	0.0014
3	0.0058
4	0.0182
5	0.0462
6	0.0978
7	0.1782
8	0.2863
9	0.4138
...	...

Dieser Hypothesentest wird gemacht um die Nullhypothese H₀: p ≥ 0.13 zu verwerfen. Der Test soll bestätigen, dass p<0.13 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H₀ auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(79,0.13,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 5 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H₀: p=0.13 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.13 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0462 =4.62% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H₀: [0;5]

Nicht-Ablehnungsbereich von H₀: [6;79]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H₀: [0;5], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H₀: [6;79], so muss die Nullhypothese beibehalten werden.

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

In dieser Aufgabe ist ja aber H₀:p=0.13 falsch, weil ja in Wirklichkeit p=0.08 ist.

Gesucht ist nun die Wahrscheinlichkeit, dass bei dem Test die Trefferanzahl nicht in den Ablehnungsbereich gefallen ist, sondern in den Bereich von 6 bis 79, so dass H₀ (irrtümlicherweise) nicht verworfen wurde.

Diese Wahrscheinlichkeit (mit dem richtigen p=0.08) beträgt nun: $P_{0.08}^{79} (X \geq 6)$ =1- $P_{0.08}^{79} (X \leq 5)$ ≈ 1-0.3874 ≈ 0.6126

Mit 61.26% Wahrscheinlichkeit landet also das Ergebnis des Test im Nicht-Ablehnungsbereich (im Histogramm oben: blauer Bereich), so dass die falsche Nullhypothese nicht verworfen wird.

Fehler 1. Art beurteilen

Beispiel:

Ein Casino hat ein Glücksrad, bei dem die Gewinnwahrscheinlichkeit für den Hauptgewinn mit 6% angegeben wird. Spielgäste haben sich beschwert, weil sie glauben, dass diese Gewinnwahrscheinlichkeit in Wirklichkeit kleiner wäre. Deswegen führt das Casino einen Hypothesentest mit 800 Drehungen dieses Glücksrads durch. Dabei soll das Risiko auf 1% begrenzt werden, dass das Glückrad aufgrund des Tests irrtümlicherweise nicht ausgetauscht wird, obwohl die Gewinnwahrscheinlichkeit niedriger als 6% ist, und dadurch sich die Glücksspielbehörde der Sache annimmt.

Entscheide dich, welche der angebotenen Nullhypothesen für diesen Test verwendet werden muss.

Lösung einblenden

Wir betrachten jede der 4 möglichen Nullhypothesen im Detail:

1. Die Gewinnwahrscheinlichkeit des Glücksrad beträgt mindestens 6%

Wenn die Nullhypothese H₀: " ... mindestens 6%", also p ≥ 0.06 lautet, soll ja der Test "bestätigen", dass p < 0.06 ist - also ist es ein linksseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im linken (orangen) Ablehnungesbreich kleiner als das Signifikanzniveau α = 1% sein muss, falls die Nullhypothese H₀: p ≥ 0.06 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≥ 0.06 abzulehnen, obwohl es stimmt, ist somit kleiner als 1%.

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≥ 0.06 irrtümlicherweise abzulehnen, damit p < 0.06 anzunehmen (obwohl dies falsch ist), und somit das Glücksrad unnötigerweise auszutauschen, auf unter 1% begrenzt werden könnte.

Mit dieser Nullhypothese würde man also ein anderes Risiko absichern, als das im Aufgabentext geforderte.

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

2. Die Gewinnwahrscheinlichkeit des Glücksrad beträgt höchstens 1%

Die Nullhypothese H₀: " ... höchstens 1%", also p ≤ 0.01 macht keinen Sinn, weil die 1%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=6% gehen, also die Gewinnwahrscheinlichkeit dieses Glücksrad.

3. Die Gewinnwahrscheinlichkeit des Glücksrad beträgt höchstens 6%

Wenn die Nullhypothese H₀: " ... höchstens 6%", also p ≤ 0.06 lautet, soll ja der Test "bestätigen", dass p > 0.06 ist - also ist es ein rechtseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im rechten (orangen) Ablehnungesbreich kleiner als das Signifikanzniveau α = 1% sein muss, falls die Nullhypothese H₀: p ≤ 0.06 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≤ 0.06 abzulehnen, obwohl es stimmt, ist somit kleiner als 1%

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≤ 0.06 irrtümlicherweise abzulehnen, damit p > 0.06 anzunehmen (obwohl dies falsch ist), und somit das Glücksrad nicht auszutauschen und Ärger mit der Glückspielbehörde zu riskieren, auf unter 1% begrenzt werden könnte.

Mit dieser Nullhypothese kann also ein Test die gegebenen Vorgaben erfüllen.

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

4. Die Gewinnwahrscheinlichkeit des Glücksrad beträgt mindestens 1%

Die Nullhypothese H₀: " ... mindestens 1%", also p ≥ 0.01 macht keinen Sinn, weil die 1%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=6% gehen, also die Gewinnwahrscheinlichkeit dieses Glücksrad.

zweiseitiger Test

Beispiel:

Ein Roulettetisch scheint ungleichmäßig zu laufen. Ein Spieler bezweifelt deswegen, dass die vorgegebene Wahrscheinlichkeit der grünen Null von p= $\frac{1}{37}$ wirklich stimmt. Diese Vermutung soll durch einen zweiseitigen Test mit 180 Drehungen des Roulettes untermauert werden. Die maximale Irrtumswahrscheinlichkeit α soll dabei 5% betragen.
In welchen Bereichen muss die Häufigkeit der grünen Null bei der Stichprobe liegen, um die Nullhypothese p= $\frac{1}{37}$ statistisch untermauert ablehnen zu können? Wie groß ist in diesem Fall die Irrtumswahrscheinlichkeit?

Lösung einblenden

k	P(X≤k)
0	0.0072
1	0.0433
2	0.1329
3	0.2807
...	...

Dieser Hypothesentest wird gemacht um die Nullhypothese H₀: p = $\frac{1}{37}$ zu verwerfen. Der Test soll bestätigen, dass p< $\frac{1}{37}$ oder p> $\frac{1}{37}$ ist, es ist ein zweiseitiger Hypothesentest.

Wir suchen somit den Ablehnungsbereich der Nullhypothese H₀ auf der linken und auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieser beiden Bereiche gerade noch kleiner als das Signifikanzniveau 5% ist.

Dazu teilen wir das Signifikanzniveau 5% gerecht auf 2.5% auf der linken und 2.5% auf der rechten Seite.

Linke Seite:

Schaut man dazu die kumulierte Binomialverteilung an (TI: binomcdf mit n=180 und p= $\frac{1}{37}$ ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 0 gerade noch weniger als 2.5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Damit haben wir den linken Teil des Ablehnungsbereichs

k	P(X≤k)
...	...
8	0.9429
9	0.9746
10	0.9897
11	0.9961
12	0.9987
...	...

Rechte Seite:

Auch am rechten Rand darf der Ablehnungsbereich höchstens 2.5% Gesamtwahrscheinlikeit auf sich vereinen, das bedeutet, dass der gesamte Bereich links vom rechten Ablehnungsbereich mindestens 1 - 0.025 = 0.975 als Wahrscheinlichkeit haben muss.

In der Tabelle links erkennt man, dass bei k=10 erstmals $P_{\frac{1}{37}}^{180} (X \leq k)$ ≥ 0.975 ist (links in der Tabelle in blau dargestellt). Das bedeutet, dass das Intervall von 11 bis 180 das größte ist, das am rechten Rand eine Gesamtwahrscheinlichkeit von unter 2.5% hat.

Der Ablehnungsbereich auf der rechten Seite ist somit von 11 bis 180.

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in eines dieser beiden Intervalle, so wäre das bei Gültigkeit der Nullhypothese H₀: p= $\frac{1}{37}$ so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p≠ $\frac{1}{37}$ als statistisch abgesichert betrachten darf.

Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von $P_{\frac{1}{37}}^{180} (X \leq 0)$ = 0.0072 auf der linken Seite und $P_{\frac{1}{37}}^{180} (X \geq 11)$ = 1-0.9897 = 0.0103 auf der rechten Seite.
Insgesamt ist somit die Irrtumswahrscheinlichkeit P_Irr = 0.0072 + 0.0103 = 0.0175 =1.75% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H₀: [0;0] und [11;180]

Nicht-Ablehnungsbereich von H₀: [1;10]

Entscheidungsregel: Fällt die Anzahl der Treffer in einen der Ablehnungsbereiche von H₀: [0;0] oder [11;180], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H₀: [1;10], so muss die Nullhypothese beibehalten werden.

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Aufgabenbeispiele von Tests

Hypothesen-Test linksseitig

Hypothesen-Test rechtseitig

Hypothesen-Test rechtseitig

Fehler 2. Art

Fehler 1. Art beurteilen

1. Die Gewinnwahrscheinlichkeit des Glücksrad beträgt mindestens 6%

2. Die Gewinnwahrscheinlichkeit des Glücksrad beträgt höchstens 1%

3. Die Gewinnwahrscheinlichkeit des Glücksrad beträgt höchstens 6%

4. Die Gewinnwahrscheinlichkeit des Glücksrad beträgt mindestens 1%

zweiseitiger Test

Linke Seite:

Rechte Seite: