Inhoud
Toetsende statistiek hoorcolleges:..........................................................................2
Hoorcollege 1: steekproevenverdelingen en Hypothesetoetsing.........................2
Hoorcollege 2: hypothesetoetsen voor gemiddelden:.........................................4
Hoorcollege 3: gemiddeldes van twee groepen vergelijken................................7
Hoorcollege 4: kansen en toetsen voor categorische variabelen:.......................9
Hoorcollege 5: effectgroottes, betrouwbaarheidsintervallen, power................13
Hoorcollege 6: Assumpties en Alternatieve Toetsen:.........................................20
Hoorcollege 7: overzicht en toets keuze............................................................25
,Toetsende statistiek hoorcolleges:
Hoorcollege 1: steekproevenverdelingen en
Hypothesetoetsing
Toetsende statistiek begint altijd met het opstellen van hypotheses (=een
uitspraak over parameters in de populatie)
Nulhypothese: er is niets aan de hand in de populatie
Alternatieve hypothese: er is wel iets aan de hand in de populatie
Daarna ga je een steekproef nemen uit de populatie, bij toetsende statistiek gaat
het over een uitspraak doen over een populatie gebaseerd op een steekproef
(d.m.v. P waarde)
Steekproevenverdeling: kijken hoeveel random variatie we kunnen verwachten
Bij controle groep/ normale konijnen steekproeven trekken en dan kijken
wat het gemiddelde daarvan is
Een verdeling van een statistiek verkregen uit alle mogelijke steekproeven
van een bepaalde grootte (n(bv 5)) uit een populatie
Steekproefverdeling: verdeling van waarden binnen 1 steekproef (niet te
verwarren met steekproevENverdeling)
Hypothesetoetsing: een statistische methode om uit steekproefdata een
uitspraak te doen over een nulhypothese
Voorbeeld one-sample t-toets, x^2-toets voor onafhankelijkheid
P-waarde: de kans op deze of een extremere toets statistiek, als in
werkelijkheid de nulhypothese waar is
o Nu hadden we gemiddelde gebruikt maar meestal gebruiken we een
specifiek soort toetsstatistiek: voordeel= hun verdeling kunnen we
berekenen zonder al die steekproeven te nemen van de populatie
onder de nulhypothese
o Een lagere p-waarde geeft meer bewijs tegen de nulhypothese
o Als de p-waarde erg laag is (0.05), is de data onwaarschijnlijk onder
de nulhypothese dus dan is de nulhypothese waarschijnlijk onjuist
Alternatief: verwerpingsgebied
Kritieke waarde: vanaf dat punt is mijn steekproefstatistiek in het
verwerpingsgebied en dan verwerpen we H0 (vaak alpha: 0.05)
Er zijn dus twee manieren om een H0 te verwerpen met een p-waarde of
met de kritieke waarde berekenen
Eenzijdig en tweezijdig toetsen
Eenzijdig: groter dan …
Tweezijdig: 1.7 aan de ene kant groter en aan de andere kant 1.7 kleiner
o Soms heeft een onderzoeker geen eenzijdige verwachting
o Ook al is een eenzijdige verwachting, dan wil je ook gevoelig zijn
voor een effect de andere kant op
, o Voor sommige toetsen kun je geen eenzijdige verwachtingen
opstellen
o Het gaat post-hoc hypothesevorming tegen (patronen vinden
achteraf)
De p-waarde wordt bij een tweezijdige alternatieve hypothese op een andere
manier berekend (een extremere toetsstatistiek kan dan zowel links (hele kleine
gem oor lengte) als rechts (hele grote gemiddelde oor lengte) gevonden worden
De p-waarde is nu de kans op de extreme waarde links + rechts dus wordt
extremer
De alpha van 0.05 is nu verdeeld over beide zijdes, de kritieke waarde
schuift daarom ook op, extremer resultaat nodig om te spreken van een
statistisch significant resultaat
Twee type fouten
Type-I-fout (kans alpha): verwerpen H0 die eigenlijk waar is, de kans dat
het wel een extreme waarde was uit de normale populatie is natuurlijk 5%
Type-II-fout (kans bèta): H0 niet verwerpen die eigenlijk niet waar is
Conclusies
Een statistisch significant resultaat zegt iets over de zekerheid dat het
effect bestaat
Maar is het ook praktisch significant of relevant? Daarvoor kijk je naar de
grootte van het effect
Toetsende statistiek hoorcolleges:..........................................................................2
Hoorcollege 1: steekproevenverdelingen en Hypothesetoetsing.........................2
Hoorcollege 2: hypothesetoetsen voor gemiddelden:.........................................4
Hoorcollege 3: gemiddeldes van twee groepen vergelijken................................7
Hoorcollege 4: kansen en toetsen voor categorische variabelen:.......................9
Hoorcollege 5: effectgroottes, betrouwbaarheidsintervallen, power................13
Hoorcollege 6: Assumpties en Alternatieve Toetsen:.........................................20
Hoorcollege 7: overzicht en toets keuze............................................................25
,Toetsende statistiek hoorcolleges:
Hoorcollege 1: steekproevenverdelingen en
Hypothesetoetsing
Toetsende statistiek begint altijd met het opstellen van hypotheses (=een
uitspraak over parameters in de populatie)
Nulhypothese: er is niets aan de hand in de populatie
Alternatieve hypothese: er is wel iets aan de hand in de populatie
Daarna ga je een steekproef nemen uit de populatie, bij toetsende statistiek gaat
het over een uitspraak doen over een populatie gebaseerd op een steekproef
(d.m.v. P waarde)
Steekproevenverdeling: kijken hoeveel random variatie we kunnen verwachten
Bij controle groep/ normale konijnen steekproeven trekken en dan kijken
wat het gemiddelde daarvan is
Een verdeling van een statistiek verkregen uit alle mogelijke steekproeven
van een bepaalde grootte (n(bv 5)) uit een populatie
Steekproefverdeling: verdeling van waarden binnen 1 steekproef (niet te
verwarren met steekproevENverdeling)
Hypothesetoetsing: een statistische methode om uit steekproefdata een
uitspraak te doen over een nulhypothese
Voorbeeld one-sample t-toets, x^2-toets voor onafhankelijkheid
P-waarde: de kans op deze of een extremere toets statistiek, als in
werkelijkheid de nulhypothese waar is
o Nu hadden we gemiddelde gebruikt maar meestal gebruiken we een
specifiek soort toetsstatistiek: voordeel= hun verdeling kunnen we
berekenen zonder al die steekproeven te nemen van de populatie
onder de nulhypothese
o Een lagere p-waarde geeft meer bewijs tegen de nulhypothese
o Als de p-waarde erg laag is (0.05), is de data onwaarschijnlijk onder
de nulhypothese dus dan is de nulhypothese waarschijnlijk onjuist
Alternatief: verwerpingsgebied
Kritieke waarde: vanaf dat punt is mijn steekproefstatistiek in het
verwerpingsgebied en dan verwerpen we H0 (vaak alpha: 0.05)
Er zijn dus twee manieren om een H0 te verwerpen met een p-waarde of
met de kritieke waarde berekenen
Eenzijdig en tweezijdig toetsen
Eenzijdig: groter dan …
Tweezijdig: 1.7 aan de ene kant groter en aan de andere kant 1.7 kleiner
o Soms heeft een onderzoeker geen eenzijdige verwachting
o Ook al is een eenzijdige verwachting, dan wil je ook gevoelig zijn
voor een effect de andere kant op
, o Voor sommige toetsen kun je geen eenzijdige verwachtingen
opstellen
o Het gaat post-hoc hypothesevorming tegen (patronen vinden
achteraf)
De p-waarde wordt bij een tweezijdige alternatieve hypothese op een andere
manier berekend (een extremere toetsstatistiek kan dan zowel links (hele kleine
gem oor lengte) als rechts (hele grote gemiddelde oor lengte) gevonden worden
De p-waarde is nu de kans op de extreme waarde links + rechts dus wordt
extremer
De alpha van 0.05 is nu verdeeld over beide zijdes, de kritieke waarde
schuift daarom ook op, extremer resultaat nodig om te spreken van een
statistisch significant resultaat
Twee type fouten
Type-I-fout (kans alpha): verwerpen H0 die eigenlijk waar is, de kans dat
het wel een extreme waarde was uit de normale populatie is natuurlijk 5%
Type-II-fout (kans bèta): H0 niet verwerpen die eigenlijk niet waar is
Conclusies
Een statistisch significant resultaat zegt iets over de zekerheid dat het
effect bestaat
Maar is het ook praktisch significant of relevant? Daarvoor kijk je naar de
grootte van het effect