Experimenteel
Zodra we hebben besloten om de nulhypothese te verwerpen, kunnen we geen
type II fout meer maken. Na een hypothesetoets kunnen we niet meer beide
fouten maken.
Effectgrootte: we kijken hoe groot het verschil eigenlijk is. We weten namelijk
dat bij een grote steekproef, een klein verschil al significant kan zijn. Als
beleidsmaker ben je meer geïnteresseerd in hoe groot het verschil is en niet zo
zeer in of het significant is.
We kunnen naar het verschil kijken door naar mean te kijken in de SPSS-output.
Het verschil is wel afhankelijk van de meetschaal en de spreiding in de scores.
We hebben behoefte aan een gestandaardiseerde maat, om te beslissen of er
een groot verschil is.
Deze vast maat voor de effectgrootte wordt de
Cohen’s D genoemd. Deze wordt bereikend
door het verschil van het gemiddelde te delen
door de maat van de standaardafwijking
(standaarddeviatie).
Hoe groter die wordt, hoe groter het
verschil/effect.
Puntschatting: als we de informatie uit de steekproef gebruiken om een
uitspraak te doen over de populatie. We zeggen dat dat we in de steekproef een
verschil vinden van 1,5 punt, dan verwachten we datzelfde verschil in de
populatie. We vertalen het verschil in de steekproef direct naar de populatie.
Maar we hebben variatie in de steekproeven, het kan dus dat we op basis van
een steekproef het verschil in de populatie niet goed kunnen inschatten. Dus als
we een puntschatting gebruiken zullen we er vaak een beetje naast zitten.
We gebruiken hierom liever een betrouwbaarheidsinterval, dit betekent dat er
een interval gebruiken om een uitspraak te doen over de populatie. We zeggen
niet dat het verschil 1,5 is, maar we zeggen dat het verschil zal liggen tussen …
en … .
Betrouwbaarheidsinterval geeft ons het betrouwbaarheidsinterval: CI for mean
difference.
, Je gaat vervolgens kijken of het daadwerkelijke verschil binnen het
betrouwbaarheidsinterval ligt. Het doel is om een juiste inschatting te maken van
de situatie in de populatie.
Hier ligt het daadwerkelijke verschil dus binnen het betrouwbaarheidsinterval,
maar het kan zijn dat dit ook buiten het betrouwbaarheidsinterval ligt. Dit
betekent dat het betrouwbaarheidsinterval 95% betrouwbaar is. Als we 100
intervallen maken, dan zal dit 95 keer de juiste inschatting zijn en 5 keer de
verkeerde inschatting van de situatie in de populatie. We hebben hier zelf invloed
op: want we kunnen zelf kiezen hoe hoog we het betrouwbaarheidsinterval
maken.
Breedte van interval zegt iets over de nauwkeurigheid van de schatting,
onderzoekers willen graag een smal interval. Want dan kunnen we gericht iets
zeggen over de populatie. Breedte van het interval hangt af van:
- Steekproefgrootte
Een grotere steekproef geeft een kleinere standaardfout à Smaller
interval
Een kleinere steekproef geeft een grotere kans op de standaardfout à
Grotere interval
- Gekozen betrouwbaarheidsniveau
De onderzoeker kiest veelal een betrouwbaarheidsniveau dat past bij het
significantieniveau. Een veel gebruikt significantieniveau is 0.05, dan