Operation Manual

Blz. 18-36
= waarde van teststatistiek, R = verwerpingsgebied, A = acceptatiegebied, dus
RA = en RA = Ω, waarbij jΩ = de parameterruimte voor T en = de lege
verzameling. De kans dat er een fout van Type I of Type II wordt gemaakt, is de
volgende:
Een ware hypothese verwerpen, Pr[Type I error] = Pr[TR|H
0
] = α
Een foute hypothese niet verwerpen, Pr[Type II error] = Pr[TA|H
1
] = β
We nemen nu alleen de gevallen waarin we de juiste beslissing maken:
Een ware hypothese niet verwerpen, Pr[Not(Type I error)] = Pr[TA|H
0
] = 1 - α
Een foute hypothese verwerpen, Pr[Not(Type II error)] = Pr [TR|H
1
] = 1 - β
Het complement van β noemen we de macht van de toets van de nulhypothese
H
0
vs. de alternatieve H
1
. De macht van een toets wordt bijvoorbeeld gebruikt
om een minimale steekproefgrootte te bepalen om zo fouten te beperken.
Waarden α en β selecteren
Een typische waarden voor het significantieniveau (of kans op een fout van
Type I) is α = 0.05, (dus gemiddeld één onjuiste verwerping op 20). Als de
gevolgen van een fout van Type I ernstiger zijn, kunt u beter kleinere waarden
van α kiezen, dus 0.01 of zelfs 0.001.
De waarde van β, dus de kans op een fout van Type II, is afhankelijk van α, de
steekproefgrootte n en van de werkelijke waarde van de getoetste parameter.
De waarde van β wordt bepaald nadat de hypothese is getests. Meestal maken
we een grafiek waarin β of de kracht van de toets (1- β) wordt weergegeven als
een functie van de werkelijke waarde van de getestte parameter. Deze
grafieken noemen we respectievelijk de curven van de keuringskarakteristiek of
de machtsfunctiecurven.
Inferenties voor een gemiddelde
Tweezijdige hypothese
Het probleem is het toetsen van de nulhypothese H
o
: μ = μ
o
, tegen de
alternatieve hypothese H
1
: μ≠ μ
ο
op een betrouwbaarheidsniveau (1-α)100%
of significatieniveau α, met een steekproef van grootte n met een gemiddelde
x en een standaardafwijking s. Deze toets noemen we een tweezijdige toets.
De procedure van deze toets is als volgt: