Aufgabenbeispiele von Tests

Durch Aktualisieren des Browsers (z.B. mit Taste F5) kann man neue Beispielaufgaben sehen


Hypothesen-Test linksseitig

Beispiel:

Ein Großhändler beklagt sich, dass gelieferte LED-Leuchtmittel mit einer Wahrscheinlichkeit von p=0,05 bereits nach wenigen Stunden defekt werden. Die herstellende Firma glaubt das nicht und hält die Ausschussquote für viel geringer. Deswegen führt sie einen Test mit 82 Leuchtmitteln durch. Als Signifikanzniveau für diesen Test wird 5% festgelegt. In welchem Bereich muss die Anzahl der defekten LED-Leuchtmittel liegen, damit die Firma die Aussage des Großhändlers widerlegt? Wie hoch bleibt die Irrtumswahrscheinlichkeit?

Lösung einblenden
kP(X≤k)
00.0149
10.0792
20.2164
30.4088
40.6088
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 0.05 zu verwerfen. Der Test soll bestätigen, dass p<0.05 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(82,0.05,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 0 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.05 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.05 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0149 =1.49% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;0]

Nicht-Ablehnungsbereich von H0: [1;82]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;0], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [1;82], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test rechtseitig

Beispiel:

Durch einen Test soll statistisch belegt werden, dass eine bestimmte Wahrscheinlichkeit p> 0,55 ist. Dazu soll die Nullhypothese H0: p=0,55 mit einer zufälligen Stichprobe (praktisch als Zufallsexperiment) der Größe n=41 verworfen werden. Die maximale Irrtumswahrscheinlichkeit α soll dabei 0,1% betragen.In welchem Bereich muss die Anzahl der Treffer bei der Stichprobe liegen, um das gewünschte Ergebnis zu erhalten? Wie groß ist in diesem Fall die Irrtumswahrscheinlichkeit?

Lösung einblenden
kP(X≤k)
......
270.9414
280.9707
290.9868
300.9947
310.9981
320.9994
330.9998
341
351
361
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ 0.55 zu verwerfen. Der Test soll bestätigen, dass p>0.55 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 0.1% ist.

Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.001= 0.999 Wahrscheinlichkeit auf sich vereinen muss.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(41,0.55,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 32 erstmals mindestens 99.9% der Gesamt-Wahrscheinlichkeit ausmachen.

Nicht-Ablehnungsbereich von H0: [0;32]

Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 33 Treffern beginnt.

Ablehnungsbereich von H0: [33;41]

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.55 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.55 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0006 =0.06% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [33;41], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;32], so muss die Nullhypothese beibehalten werden.

12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test rechtseitig

Beispiel:

In einem Multiple Choice Test ist bei jeder der 50 Aufgaben genau eine von fünf Lösungsmöglichkeiten richtig. In welchem Intervall muss die Anzahl der richtigen Antworten von Kevin liegen, damit er seiner Mutter (mit einer max. Irrtumswahrscheinlichkeit von 0,1%) nachweisen kann, dass er auf den Test etwas gelernt und dadurch etwas gewusst hat und nicht jede Frage dem Zufall überließ? Gib die Irrtumswahrscheinlichkeit an!

Lösung einblenden
kP(X≤k)
......
140.9393
150.9692
160.9856
170.9937
180.9975
190.9991
200.9997
210.9999
221
231
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ 0.2 zu verwerfen. Der Test soll bestätigen, dass p>0.2 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 0.1% ist.

Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.001= 0.999 Wahrscheinlichkeit auf sich vereinen muss.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(50,0.2,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 19 erstmals mindestens 99.9% der Gesamt-Wahrscheinlichkeit ausmachen.

Nicht-Ablehnungsbereich von H0: [0;19]

Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 20 Treffern beginnt.

Ablehnungsbereich von H0: [20;50]

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.2 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.2 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0009 =0.09% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [20;50], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;19], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Fehler 2. Art

Beispiel:

Ein spielsüchtiger 12-Klässler möchte nachweisen, dass ein bestimmter Würfel gezinkt ist und zu selten eine 6 kommt. Dazu macht er einen Signifikanztest mit 81 Würfen und einem Signifikanzniveau von 0,1%. a) In welchem Bereich muss die Anzahl der 6er liegen, damit er die Spielbank verklagen kann. b) In Wirklichkeit ist der Würfel tatsächlich manipuliert und würfelt nur mit der Wahrscheinlichkeit von 12% eine sechs. Wie groß ist nun die Wahrscheinlichkeit, dass bei dem Test trotzdem die Anzahl der Sechsen nicht in den Ablehnungsbereich gefallen ist und somit - irrtümlicherweise - die falsche Nullhypothese nicht verworfen wurde?

Lösung einblenden
kP(X≤k)
00
10
20.0001
30.0003
40.0013
50.0045
60.0125
70.0297
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 1 6 zu verwerfen. Der Test soll bestätigen, dass p< 1 6 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 0.1% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(81, 1 6 ,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 3 weniger als 0.1% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p= 1 6 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p< 1 6 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0003 =0.03% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;3]

Nicht-Ablehnungsbereich von H0: [4;81]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;3], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [4;81], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

In dieser Aufgabe ist ja aber H0:p= 1 6 falsch, weil ja in Wirklichkeit p=0.12 ist.

Gesucht ist nun die Wahrscheinlichkeit, dass bei dem Test die Trefferanzahl nicht in den Ablehnungsbereich gefallen ist, sondern in den Bereich von 4 bis 81, so dass H0 (irrtümlicherweise) nicht verworfen wurde.

Diese Wahrscheinlichkeit (mit dem richtigen p=0.12) beträgt nun: P0.1281 (X4) =1- P0.1281 (X3) ≈ 1-0.0092 ≈ 0.9908

Mit 99.08% Wahrscheinlichkeit landet also das Ergebnis des Test im Nicht-Ablehnungsbereich (im Histogramm oben: blauer Bereich), so dass die falsche Nullhypothese nicht verworfen wird.

Fehler 1. Art beurteilen

Beispiel:

Der Hersteller eines Männershampoos bewirbt sein Produkt damit, dass es bei 80% aller Probanden die kahlen Stellen am Kopf wieder zuwachsen lassen würde. Weil bei Verbraucherschützern Zweifel daran aufkommen, lässt die Firma einen Hypothesentest mit 600 Männern durchführen, die täglich das Shampoo benutzen müssen. Dabei soll das Risiko auf 16% begrenzt werden, dass aufgrund des Tests weiterhin mit diesem Prozentsatz geworben wird, obwohl dieser in Wirklichkeit niedriger liegt und die Gefahr einer Klage von Verbraucherschützern droht.

Entscheide dich, welche der angebotenen Nullhypothesen für diesen Test verwendet werden muss.

Lösung einblenden

Wir betrachten jede der 4 möglichen Nullhypothesen im Detail:

1. Der Prozentsatz der Männer, bei denen das Shampoo wirkt, beträgt höchstens 80%

ok

Wenn die Nullhypothese H0: " ... höchstens 80%", also p ≤ 0.8 lautet, soll ja der Test "bestätigen", dass p > 0.8 ist - also ist es ein rechtseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im rechten (orangen) Ablehnungesbreich kleiner als das Signifikanzniveau α = 16% sein muss, falls die Nullhypothese H0: p ≤ 0.8 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≤ 0.8 abzulehnen, obwohl es stimmt, ist somit kleiner als 16%

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≤ 0.8 irrtümlicherweise abzulehnen, damit p > 0.8 anzunehmen (obwohl dies falsch ist), und somit weiterhin mit diesem hohen Prozentsatz zu werben, obwohl er in Wirklichkeit niedriger ist und eine Klage von Verbraucherschützern riskieren, auf unter 16% begrenzt werden könnte.

Mit dieser Nullhypothese kann also ein Test die gegebenen Vorgaben erfüllen.

458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503

2. Der Prozentsatz der Männer, bei denen das Shampoo wirkt, beträgt mindestens 80%

error

Wenn die Nullhypothese H0: " ... mindestens 80%", also p ≥ 0.8 lautet, soll ja der Test "bestätigen", dass p < 0.8 ist - also ist es ein linksseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im linken (orangen) Ablehnungesbreich kleiner als das Signifikanzniveau α = 16% sein muss, falls die Nullhypothese H0: p ≥ 0.8 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≥ 0.8 abzulehnen, obwohl es stimmt, ist somit kleiner als 16%.

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≥ 0.8 irrtümlicherweise abzulehnen, damit p < 0.8 anzunehmen (obwohl dies falsch ist), und somit nicht mehr mit diesem hohen Prozentsatz zu werben, obwohl dieser richtig ist, auf unter 16% begrenzt werden könnte.

Mit dieser Nullhypothese würde man also ein anderes Risiko absichern, als das im Aufgabentext geforderte.

456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501

3. Der Prozentsatz der Männer, bei denen das Shampoo wirkt, beträgt höchstens 16%

error

Die Nullhypothese H0: " ... höchstens 16%", also p ≤ 0.16 macht keinen Sinn, weil die 16%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=80% gehen, also den Prozentsatz der Männer, bei denen das Shampoo wirkt.

4. Der Prozentsatz der Männer, bei denen das Shampoo wirkt, beträgt mindestens 16%

error

Die Nullhypothese H0: " ... mindestens 16%", also p ≥ 0.16 macht keinen Sinn, weil die 16%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=80% gehen, also den Prozentsatz der Männer, bei denen das Shampoo wirkt.

zweiseitiger Test

Beispiel:

Ein Roulettetisch scheint ungleichmäßig zu laufen. Ein Spieler bezweifelt deswegen, dass die vorgegebene Wahrscheinlichkeit der grünen Null von p= 1 37 wirklich stimmt. Diese Vermutung soll durch einen zweiseitigen Test mit 230 Drehungen des Roulettes untermauert werden. Die maximale Irrtumswahrscheinlichkeit α soll dabei 5% betragen.
In welchen Bereichen muss die Häufigkeit der grünen Null bei der Stichprobe liegen, um die Nullhypothese p= 1 37 statistisch untermauert ablehnen zu können? Wie groß ist in diesem Fall die Irrtumswahrscheinlichkeit?

Lösung einblenden
kP(X≤k)
00.0018
10.0135
20.0508
30.1294
40.2534
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p = 1 37 zu verwerfen. Der Test soll bestätigen, dass p< 1 37 oder p> 1 37 ist, es ist ein zweiseitiger Hypothesentest.

Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken und auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieser beiden Bereiche gerade noch kleiner als das Signifikanzniveau 5% ist.

Dazu teilen wir das Signifikanzniveau 5% gerecht auf 2.5% auf der linken und 2.5% auf der rechten Seite.

Linke Seite:

Schaut man dazu die kumulierte Binomialverteilung an (TI: binomcdf mit n=230 und p= 1 37 ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 1 gerade noch weniger als 2.5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Damit haben wir den linken Teil des Ablehnungsbereichs

kP(X≤k)
......
90.9033
100.9502
110.9763
120.9895
130.9957
......

Rechte Seite:

Auch am rechten Rand darf der Ablehnungsbereich höchstens 2.5% Gesamtwahrscheinlikeit auf sich vereinen, das bedeutet, dass der gesamte Bereich links vom rechten Ablehnungsbereich mindestens 1 - 0.025 = 0.975 als Wahrscheinlichkeit haben muss.

In der Tabelle links erkennt man, dass bei k=11 erstmals P 1 37 230 (Xk) ≥ 0.975 ist (links in der Tabelle in blau dargestellt). Das bedeutet, dass das Intervall von 12 bis 230 das größte ist, das am rechten Rand eine Gesamtwahrscheinlichkeit von unter 2.5% hat.

Der Ablehnungsbereich auf der rechten Seite ist somit von 12 bis 230.

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in eines dieser beiden Intervalle, so wäre das bei Gültigkeit der Nullhypothese H0: p= 1 37 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p≠ 1 37 als statistisch abgesichert betrachten darf.

Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von P 1 37 230 (X1) = 0.0135 auf der linken Seite und P 1 37 230 (X12) = 1-0.9763 = 0.0237 auf der rechten Seite.
Insgesamt ist somit die Irrtumswahrscheinlichkeit PIrr = 0.0135 + 0.0237 = 0.0372 =3.72% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;1] und [12;230]

Nicht-Ablehnungsbereich von H0: [2;11]

Entscheidungsregel: Fällt die Anzahl der Treffer in einen der Ablehnungsbereiche von H0: [0;1] oder [12;230], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [2;11], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)