Toets, we toetsen om te kijken of een observatie van betekenis is of dat het toeval is.
Voorbeeld, jaren terug is het voorval geweest dat de vraag gesteld werd of er gediscrimineerd werd
bij het samenstellen van de jury van een rechtszaak. Als je een gemeenschap hebt waarvan de helft
Afro-Amerikaans is en je daar een groep uithaalt van 80 mensen, waarvan er uiteindelijk maar 4
zwart zijn, kan je je afvragen of dat resultaat toeval is of dat er discriminatie heeft opgetreden. Als
we nu voor ‘the sake of argument’ even aannemen dat hier random selectie heeft plaatsgevonden,
zou het aantal Afro-Amerikanen in het 80 personen panel volgens een binomiale verdeling van
random variabele X verdeeld zijn met n=80 en p=0,50. Je kan nu uitrekenen hoe groot de kans is dat
de jury maar 4 Afro-Amerikanen bevat en die is Pr(𝑋 ≤ 4) = 0,0000000000000000014. De kans
dat het dus toeval is dat er maar 4 Afro-Amerikanen in het jurypanel zitten is heel klein en het lijkt
erop dat er discriminatie heeft plaatsgevonden. Je hebt nu gekeken wat de kans is dat het toeval is
en die kans is zo klein dat er een sterk argument tegen de aanname van onbevooroordeelde selectie
is.
Statistische toets, is een procedure die bedoeld is om:
- Conclusies te trekken over je gegevens, maar ondertussen
- De kans op een foute conclusie zo klein mogelijk te maken.
Je trekt hier dus op een beredeneerde manier conclusies en daarvoor ‘berecht’ je een sceptische
nulhypothese (H0). Je gaat dan kijken of je deze conclusie kan verwerpen of aan kan nemen. Als de
bevindingen teveel afwijken van de verwachting onder H0, dan verwerpen we H0. In het voorbeeld
was de H0 dat de jury op een eerlijke manier was samengesteld en je neemt dus eerst aan dat ze
nulhypothese juist is en dan ga je kijken of je bevindingen en observaties binnen de verwachting van
de H0 vallen. Als hetgeen wat je observeert heel onwaarschijnlijk is onder je aanname (H0) dan kan je
hem verwerpen. Vaak formuleer je dan naast H0 een alternatieve hypothese (HA) en dat is als het
ware de ontkenning van H0. Als je H0 dus verwerpt, kan je HA aannemen.
Fouten, bij het uitvoeren van een toets zijn er twee soorten fouten die je kan maken:
- Type I, H0 is waar, maar je gaat hem toch
verwerpen. Zo kan het dat er eens in de
zoveel tijd heel weinig zwarte mensen in
de jury zitten door puur toeval. De kans α
op een type I fout heet het
significantieniveau of de
onbetrouwbaarheid: 𝛼 = Pr[𝐻0 𝑤𝑜𝑟𝑑𝑡𝑣𝑒𝑟𝑤𝑜𝑟𝑝𝑒𝑛|𝐻0 𝑖𝑠𝑤𝑎𝑎𝑟]. Dit is dus de kans dat H0
verworpen wordt gegeven dat H0 waar is. | staat hier voor ‘gegeven dat’. Een type I fout
wordt ook wel een false positive genoemd. Je denkt hierbij dat je een probleem/iets
gevonden hebt, maar in werkelijkheid is dat niet zo.
- Type II, H0 is niet waar, maar wordt niet verworpen. De kans hierop ziet er als volgt uit: 𝛽 =
Pr[𝐻0 𝑤𝑜𝑟𝑑𝑡𝑛𝑖𝑒𝑡𝑣𝑒𝑟𝑤𝑜𝑟𝑝𝑒𝑛|𝐻0 𝑖𝑠𝑛𝑖𝑒𝑡𝑤𝑎𝑎𝑟]. Een type II fout noem je ook wel een
false negative.
Dilemma, als je een procedure gaat opstellen voor je toets, wil je kans op een type I of II fout zo klein
mogelijk houden. Je moet je hierbij de vraag stellen hoe onwaarschijnlijk de bevindingen precies
moeten zijn voordat je H0 verwerpt. Deze grens is heel lastig te bepalen en levert je een dilemma,
want een streng criterium zorgt ervoor dat α klein is, maar het nadeel van zo’n streng criterium is dat
β dan groot is. Als je dit toepast op een rechtszaak krijg je de volgende mogelijke situatie:
- Als je mensen alleen veroordeelt als het bewijs geen enkele ruimte laat voor twijfel, zal je
haast nooit een onschuldige de gevangenis insturen. (kleine kans op type-I fout)
- Hierdoor blijven veel misdaden echter ongestraft. (grote kans op type-II fout)
Je beleid zal dus altijd een compromis zijn tussen een kleine α en een kleine β. Als de consequentie
van een type-I fout veel groter is als die van een type-II fout, heb je liever dat α klein is dan β.
Z-toets voor 1 steekproef, hierbij vergelijk je je gemiddelde met een bepaalde waarde als 𝜎 bekend
is. Dit wordt behandeld met een voorbeeld waarbij we weten dat zeeslakken onder natuurlijke
omstandigheden een zuurstofopname 𝑌 gemiddeld hebben van 8,0𝜇𝑚𝑜𝑙/ℎ/𝑔. Vervolgens houden