HYPOTHESES
je begint altijd met het opstellen van hypotheses
hypothese = uitspraak over parameters in de populatie
- bv: onze parameter is het gemiddelde (μ) van konijnenoren in een tuin
Nulhypothese ( ) = zegt dat er niets aan de hand is in de populatie. er is geen
verandering/verschil/relatie
Alternatieve hypothese ( ) = zegt er is iets aan de hand in de populatie, vaak is dit onze
verwachting
- bv: H0: μ = 7, Ha: μ > 7 (dit is een rechtszijdige alternatieve hypothese)
STEEKPROEF NEMEN
uit een populatie neem je een steekproef. de steekproef bevat niet de volledige populatie
van alle individuen in de steekproef doe je een meting, en hiervan neem je het
gemiddelde
- bv: Mijn steekproefgemiddelde is 8.7, en het gemiddelde van normale konijnen is
7.0. Hebben de konijnen in mijn tuin langere oren? weet ik dat zeker? met welke
zekerheid kan ik dat zeggen?
CONCLUSIE
toetsende statistiek gaat over het doen van een uitspraak over een populatie gebaseerd
op een steekproef.
steekproef = random
hoe weten we dat het verschil in onze steekproef niet door toeval is ontstaan?
- Idee: bepaal hoeveel random variatie we kunnen verwachten
(steekproevenverdeling) en vergelijk het verschil in onze steekproef daarmee
STEEKPROEVENVERDELING
steekproevenverdeling maak je gebaseerd op de gehele populatie
als je op normale konijnen een steekproef zou nemen, hoe groot zou het gemiddelde
dan zijn?
je vergelijkt de verdeling die jij hebt gevonden (steekproefverdeling) met de verdelingen
van de gehele populatie (steekproevenverdeling)
elk punt in de grafiek is het gemiddelde van een steekproef
,steekproevenverdeling = verdeling van een statistiek verkregen uit alle mogelijke
steekproeven van een bepaalde grootte (n) uit een populatie
- de breedte van de steekproevenverdeling hangt af van hoeveel individuen er in een
steekproef zitten
steekproefverdeling = verdeling van waarden binnen één steekproef
HYPOTHESETOETSING
steekproevenverdeling gebruik je voor hypothesetoetsing
hypothesetoets = statistische methode om uit steekproefdata een uitspraak te doen over
een nulhypothese
de vraag is dus: hoe uitzonderlijk is onze steekproef? hoe waarschijnlijk is het om een
gemiddelde van 8.7 te hebben als de konijnen in mijn tuin normale konijnen zouden zijn?
rode bolletje. het is mogelijk dat het gewoon normale konijnen zijn
de kans om door toeval 8.7 of hoger te krijgen is 3/100=0.03 dus 3%
dit bereken je door: er zijn 100 bolletjes (100 steekproeven) waarbij 3 bolletjes een
gemiddelde van 8.7 of hoger zijn
p-waarde = kans op deze (8.7) of een extremere (8.7>) toetsstatistiek, als in werkelijkheid
de nulhypothese waar is
de statistiek die we hier gebruikt hebben is het gemiddelde. maat meestal gebruiken we een
specifiek soort toetsstatistiek. bv: t-statistiek, χ2 statistiek
- je berekent iets en transformeert het naar een toetsstatistiek
,het voordeel hiervan is dat we de verdeling van toetsstatistieken kunnen berekenen zonder
al die steekproeven te nemen van de populatie onder de nulhypothese. we weten dus hun
steekproevenverdeling
de grenswaarde van de p waarde is 0.05. een lagere p waarde geeft meer bewijs tegen de
nulhypothese. als de p waarde erg laag is, is de data onwaarschijnlijk onder de
nulhypothese. dus dan is de nulhypothese waarschijnlijk onjuist
SIGNIFICANTIENIVEAU
we kiezen een significantieniveau α. deze is meestal 0.05
als de kans (p waarde) kleiner is dan deze waarde verwerpen we H0
Dus verwerp H0 als p ≤ α
deze α geeft ook een kritieke waarde en een verwerpingsgebied
(zie verticale lijn)
als steekproef statistiek in het verwerpingsgebied ligt (het gebied rechts van de verticale lijn)
dan verwerpen we H0
Dus verwerp H0 als x (= kritieke waarde, waarde die hoort bij verticale lijn) ≥ xα
kritieke waarde: voor een alpha van 0.05, welk gemiddelde heb je daarvoor nodig?
PRAKTIJK
onderzoekers kiezen significantieniveau α (vaak 0.05)
rapporteren zowel de p-waarde als de beslissing (verwerpen of niet) over de nulhypothese
lagere p-waarden worden gezien als sterker bewijs
EENZIJDIG & TWEEZIJDIG TOETSEN
het is echter gebruikelijker om met een tweezijdige alternatieve hypothese te werken
- H0: μ = 7, Ha: μ 7
waarom tweezijdig?
- soms heb je als onderzoeker geen eenzijdige verwachting
- ook al is er een eenzijdige verwachting, dan wil je ook gevoelig zijn voor een effect
de andere kant op
- voor sommige toetsen kun je geen eenzijdige verwachtingen opstellen. bv je hebt
heel veel groepen.
- het gaat post-hoc hypothesevorming tegen. bv je eigenlijke hypothese is dat het
gemiddelde groter zal zijn, vervolgens vind je achteraf dat het kleiner is en doe je
alsof je dat vanaf het begin al dacht.
, de p-waarde wordt bij een tweezijdige alternatieve hypothese op een andere manier
berekend
want een extremere toetsstatistiek kan dan zowel links als rechts gevonden worden
- bv: de p-waarde is nu de kans op 8.7 of hoger, plus de kans op 5.3 of lager. de
p-waarde is nu 0.05
de α van 0.05 is nu verdeeld over beide zijdes (2 verticale lijnen). de kritieke waarde
schuift daarom ook op. je hebt een extremer resultaat nodig om te spreken van een
statistisch significant resultaat
- De p-waarde is dus groter want je kijkt niet alleen naar wat significant hoger maar
ook naar wat significant lager is. 3/100 + 2/100 = 0.03 + 0.02 = 0.05
FOUTEN
maar: onze steekproef was een willekeurige (random) steekproef, dus we kunnen een fout
begaan
- Type-1-fout (kans α): verwerp een nulhypothese die eigenlijk waar is. de kans dat dit
gebeurt is 5%
- Type-2-fout (kans β) nulhypothese niet verwerpen, terwijl hij wel onjuist is. de kans
hierop hangt af van verschillende factoren
statistische power = kans op het verwerpen van een nulhypothese terwijl deze ook niet waar
is, tegenovergestelde van β
CONCLUSIE
we hebben een statistisch significant resultaat. dat zegt iets over de zekerheid dat het effect
bestaat
maar: is het ook praktisch significant of relevant? daarvoor kijk je naar de grootte van het
effect
STAPPEN IN HYPOTHESETOETSING