Aufgabenbeispiele von Tests

Durch Aktualisieren des Browsers (z.B. mit Taste F5) kann man neue Beispielaufgaben sehen


Hypothesen-Test linksseitig

Beispiel:

Eine Pharmafirma behauptet, dass durch eine Verbesserung der Rezeptur die Nebenwirkungen eines Medikaments unter p=0,85 gesunken ist. Um dies nachzuweisen, soll ein 67-stufiger Test mit einer maximalen Irrtumswahrscheinlichkeit von 5% durchgeführt werden. In welchem Intervall muss hierfür die Anzahl der Nebenwirkungen liegen? Wie hoch ist die Irrtumswahrscheinlichkeit?

Lösung einblenden
kP(X≤k)
......
460.0006
470.0015
480.0037
490.0085
500.0183
510.0369
520.0692
530.1211
540.1974
550.2995
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 0.85 zu verwerfen. Der Test soll bestätigen, dass p<0.85 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(67,0.85,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 51 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.85 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.85 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0369 =3.69% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;51]

Nicht-Ablehnungsbereich von H0: [52;67]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;51], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [52;67], so muss die Nullhypothese beibehalten werden.

46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test rechtseitig

Beispiel:

Einem partystarken 12-Klässler wird von einem nicht ganz vorurteilsfreien Lehrer vorgeworfen, nichts auf die Klassenarbeit gelernt haben. Diese findet in Form eines Multiple Choice-Tests mit 67 Aufgaben statt, bei der genau eine der vier Antwortmöglichkeiten richtig ist. In welchem Bereich muss nun die Anzahl der richtigen Antworten liegen, damit er auf einem Signifikanzniveau von 5% die Behauptung des Lehrers widerlegen kann.

Lösung einblenden
kP(X≤k)
......
180.6954
190.7838
200.8546
210.9074
220.9442
230.9682
240.9829
250.9913
260.9958
270.9981
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ 0.25 zu verwerfen. Der Test soll bestätigen, dass p>0.25 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.05= 0.95 Wahrscheinlichkeit auf sich vereinen muss.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(67,0.25,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 23 erstmals mindestens 95% der Gesamt-Wahrscheinlichkeit ausmachen.

Nicht-Ablehnungsbereich von H0: [0;23]

Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 24 Treffern beginnt.

Ablehnungsbereich von H0: [24;67]

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.25 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.25 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0318 =3.18% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [24;67], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;23], so muss die Nullhypothese beibehalten werden.

3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test linksseitig

Beispiel:

Zlatan Ibrahimovic behauptet von sich, dass er mit mindestens 90% Wahrscheinlichkeit von der Strafraumgrenze die Querlatte des Tores treffe. Obwohl Ibrahimovic für seine geradezu legendäre Bescheidenheit und Demut bekannt ist, zweifelt ein Mitspieler an dieser Quote. Sie einigen sich auf einen Test mit 72 Versuchen und einem Signifikanzniveau von 0,1% (was auch immer Ibrahimovic darunter verstehen mag). In welchem Bereich muss die Anzahl der Lattentreffer liegen um den schwedischen Stürmer der Prahlerei zu überführen?

Lösung einblenden
kP(X≤k)
......
500
510
520
530.0001
540.0002
550.0006
560.0017
570.0046
580.0112
590.0254
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 0.9 zu verwerfen. Der Test soll bestätigen, dass p<0.9 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 0.1% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(72,0.9,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 55 weniger als 0.1% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.9 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.9 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0006 =0.06% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;55]

Nicht-Ablehnungsbereich von H0: [56;72]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;55], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [56;72], so muss die Nullhypothese beibehalten werden.

50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Fehler 2. Art

Beispiel:

Eine Pharmafirma behauptet, dass durch eine Verbesserung der Rezeptur die Nebenwirkungen eines Medikament unter p=0,15 gesunken ist. Um dies nachzuweisen, soll ein 63-stufiger Test mit einer maximalen Irrtumswahrscheinlichkeit von 5% durchgeführt werden. a) In welchem Intervall muss hierfür die Anzahl der Nebenwirkungen liegen? b) In Wirklichkeit liegt die Wahrscheinlickeit für Nebenwirkungen bei p=0,08. Wie groß ist nun die Wahrscheinlichkeit, dass bei dem Test trotzdem die Anzahl der Nebenwirkungen nicht in den Ablehnungsbereich gefallen ist und somit - irrtümlicherweise - die falsche Nullhypothese nicht verworfen wurde?

Lösung einblenden
kP(X≤k)
00
10.0004
20.0026
30.0104
40.0311
50.0741
60.1475
70.2529
80.3832
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 0.15 zu verwerfen. Der Test soll bestätigen, dass p<0.15 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(63,0.15,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 4 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.15 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.15 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0311 =3.11% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;4]

Nicht-Ablehnungsbereich von H0: [5;63]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;4], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [5;63], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

In dieser Aufgabe ist ja aber H0:p=0.15 falsch, weil ja in Wirklichkeit p=0.08 ist.

Gesucht ist nun die Wahrscheinlichkeit, dass bei dem Test die Trefferanzahl nicht in den Ablehnungsbereich gefallen ist, sondern in den Bereich von 5 bis 63, so dass H0 (irrtümlicherweise) nicht verworfen wurde.

Diese Wahrscheinlichkeit (mit dem richtigen p=0.08) beträgt nun: P0.0863 (X5) =1- P0.0863 (X4) ≈ 1-0.4259 ≈ 0.5741

Mit 57.41% Wahrscheinlichkeit landet also das Ergebnis des Test im Nicht-Ablehnungsbereich (im Histogramm oben: blauer Bereich), so dass die falsche Nullhypothese nicht verworfen wird.

Fehler 1. Art beurteilen

Beispiel:

Der Hersteller eines Männershampoos bewirbt sein Produkt damit, dass es bei 40% aller Probanden die kahlen Stellen am Kopf wieder zuwachsen lassen würde. Weil bei Verbraucherschützern Zweifel daran aufkommen, lässt die Firma einen Hypothesentest mit 900 Männern durchführen, die täglich das Shampoo benutzen müssen. Dabei soll das Risiko auf 2% begrenzt werden, dass aufgrund des Tests weiterhin mit diesem Prozentsatz geworben wird, obwohl dieser in Wirklichkeit niedriger liegt und die Gefahr einer Klage von Verbraucherschützern droht.

Entscheide dich, welche der angebotenen Nullhypothesen für diesen Test verwendet werden muss.

Lösung einblenden

Wir betrachten jede der 4 möglichen Nullhypothesen im Detail:

1. Der Prozentsatz der Männer, bei denen das Shampoo wirkt, beträgt mindestens 2%

error

Die Nullhypothese H0: " ... mindestens 2%", also p ≥ 0.02 macht keinen Sinn, weil die 2%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=40% gehen, also den Prozentsatz der Männer, bei denen das Shampoo wirkt.

2. Der Prozentsatz der Männer, bei denen das Shampoo wirkt, beträgt höchstens 2%

error

Die Nullhypothese H0: " ... höchstens 2%", also p ≤ 0.02 macht keinen Sinn, weil die 2%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=40% gehen, also den Prozentsatz der Männer, bei denen das Shampoo wirkt.

3. Der Prozentsatz der Männer, bei denen das Shampoo wirkt, beträgt mindestens 40%

error

Wenn die Nullhypothese H0: " ... mindestens 40%", also p ≥ 0.4 lautet, soll ja der Test "bestätigen", dass p < 0.4 ist - also ist es ein linksseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im linken (orangen) Ablehnungesbreich kleiner als das Signifikanzniveau α = 2% sein muss, falls die Nullhypothese H0: p ≥ 0.4 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≥ 0.4 abzulehnen, obwohl es stimmt, ist somit kleiner als 2%.

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≥ 0.4 irrtümlicherweise abzulehnen, damit p < 0.4 anzunehmen (obwohl dies falsch ist), und somit nicht mehr mit diesem hohen Prozentsatz zu werben, obwohl dieser richtig ist, auf unter 2% begrenzt werden könnte.

Mit dieser Nullhypothese würde man also ein anderes Risiko absichern, als das im Aufgabentext geforderte.

328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373

4. Der Prozentsatz der Männer, bei denen das Shampoo wirkt, beträgt höchstens 40%

ok

Wenn die Nullhypothese H0: " ... höchstens 40%", also p ≤ 0.4 lautet, soll ja der Test "bestätigen", dass p > 0.4 ist - also ist es ein rechtseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im rechten (orangen) Ablehnungesbreich kleiner als das Signifikanzniveau α = 2% sein muss, falls die Nullhypothese H0: p ≤ 0.4 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≤ 0.4 abzulehnen, obwohl es stimmt, ist somit kleiner als 2%

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≤ 0.4 irrtümlicherweise abzulehnen, damit p > 0.4 anzunehmen (obwohl dies falsch ist), und somit weiterhin mit diesem hohen Prozentsatz zu werben, obwohl er in Wirklichkeit niedriger ist und eine Klage von Verbraucherschützern riskieren, auf unter 2% begrenzt werden könnte.

Mit dieser Nullhypothese kann also ein Test die gegebenen Vorgaben erfüllen.

346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391

zweiseitiger Test

Beispiel:

Ein Würfel wirkt etwas unwuchtig, so als ob nicht alle Bereiche des Körpers gleich schwer wären. Deswegen wird vermutet, dass die Wahrscheinlichkeit, eine Sechs mit diesem Würfel zu würfeln, p ≠ 1 6 sein müsste. Diese Vermutung soll durch einen zweiseitigen Test mit 50 mal würfeln untermauert werden. Die maximale Irrtumswahrscheinlichkeit α soll dabei 5% betragen.
In welchen Bereichen muss die Anzahl der gewürfelten Sechser bei der Stichprobe liegen, um die Nullhypothese p= 1 6 statistisch untermauert ablehnen zu können?
Wie groß ist in diesem Fall die Irrtumswahrscheinlichkeit?

Lösung einblenden
kP(X≤k)
......
20.0066
30.0238
40.0643
50.1388
60.2506
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p = 1 6 zu verwerfen. Der Test soll bestätigen, dass p< 1 6 oder p> 1 6 ist, es ist ein zweiseitiger Hypothesentest.

Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken und auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieser beiden Bereiche gerade noch kleiner als das Signifikanzniveau 5% ist.

Dazu teilen wir das Signifikanzniveau 5% gerecht auf 2.5% auf der linken und 2.5% auf der rechten Seite.

Linke Seite:

Schaut man dazu die kumulierte Binomialverteilung an (TI: binomcdf mit n=50 und p= 1 6 ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 3 gerade noch weniger als 2.5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Damit haben wir den linken Teil des Ablehnungsbereichs

kP(X≤k)
......
120.9373
130.9693
140.9862
150.9943
160.9978
......

Rechte Seite:

Auch am rechten Rand darf der Ablehnungsbereich höchstens 2.5% Gesamtwahrscheinlikeit auf sich vereinen, das bedeutet, dass der gesamte Bereich links vom rechten Ablehnungsbereich mindestens 1 - 0.025 = 0.975 als Wahrscheinlichkeit haben muss.

In der Tabelle links erkennt man, dass bei k=14 erstmals P 1 6 50 (Xk) ≥ 0.975 ist (links in der Tabelle in blau dargestellt). Das bedeutet, dass das Intervall von 15 bis 50 das größte ist, das am rechten Rand eine Gesamtwahrscheinlichkeit von unter 2.5% hat.

Der Ablehnungsbereich auf der rechten Seite ist somit von 15 bis 50.

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in eines dieser beiden Intervalle, so wäre das bei Gültigkeit der Nullhypothese H0: p= 1 6 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p≠ 1 6 als statistisch abgesichert betrachten darf.

Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von P 1 6 50 (X3) = 0.0238 auf der linken Seite und P 1 6 50 (X15) = 1-0.9862 = 0.0138 auf der rechten Seite.
Insgesamt ist somit die Irrtumswahrscheinlichkeit PIrr = 0.0238 + 0.0138 = 0.0377 =3.77% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;3] und [15;50]

Nicht-Ablehnungsbereich von H0: [4;14]

Entscheidungsregel: Fällt die Anzahl der Treffer in einen der Ablehnungsbereiche von H0: [0;3] oder [15;50], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [4;14], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)