Hoorcollege 1
Toetsende statistiek wordt gebruikt om een uitspraak te doen over de populatie
- Op basis van beschrijvende statistieken in de steekproef
Met behulp van toetsende statistiek kan er antwoord gegeven worden op vragen als:
- Zijn vrouwen slimmer dan mannen?
- Zijn kinderen met broertjes en/of zusjes socialer dan kinderen zonder broertjes en/of
zusjes?
- Verhoogt de wiskundetraining studieprestatie?
- Zijn ouderen in de stad gelukkiger dan ouderen op het platteland?
Twee soorten toetsende statistieken
→ Schatten van populatieparameters op basis van gevonden gegevens in de steekproef
- Statistieken: puntschattingen en betrouwbaarheidsintervallen
→ Toetsen van hypothesen over populatieparameters op basis van de gevonden gegevens in
de steekproef
- Statistieken: toetsingsgegevens en -resultaten
Betrouwbaarheidsinterval
Inferentiële statistiek: steekproef → populatie
De populatieparameter heeft een vaste waarde (p)
- Er is een exact aantal studenten POW waarvan een exact aantal vrouwelijke
studenten
- Maar die aantallen zijn onbekend, dus p is onbekend
De steekproefwaarde kan gebruikt worden als een schatting (p met dakje) van de
populatieparameter
- Deze schatting kent een bepaalde onzekerheid
Stel: er zitten nu toevallig veel vrouwelijke studenten in de zaal
Dan is de gevonden proportie groter dan de proportie in de populatie.
Stel ook: we onderzoeken het aantal vrouwelijke studenten bij elk hoorcollege
Soms zijn er wat meer, soms wat minder vrouwen aanwezig
Gemiddeld over alle mogelijke steekproeven zal de gemiddelde steekproef waarde gelijk zijn
aan de werkelijke waarde gelijk zijn aan de werkelijke waarde in de populatie.
Betrouwbaarheidsinterval
- We gebruiken de gegevens in de steekproef om een schatting te maken van de
populatieparameter
- De precisie van deze schatting geven we aan met behulp van een
betrouwbaarheidsinterval (BI) (Confidence interval)
1
,Het betrouwbaarheidsinterval geeft ‘plausibele’ waarden voor de populatieparameter op
basis van:
- De puntschatting (gevonden proportie/gemiddelde/verschil etc)
- Kritieke grenzen behorend bij de toetsingsgrootheid (t, z, etc)
- Standaardfout van de puntschatting
- Houdbaarheid van de aannamen die je doet (bijv. normaliteit)
2
,Nulhypothesetoets
1. Assumpties
2. Hypothese (nulhypothese en alternatieve hypothese = zijn we geïnteresseerd)
3. Toetsingsgrootheid
4. P-waarde
5. Conclusie
Assumpties bij proporties
- Steekproef willekeurig getrokken
- Categorische variabele
- Steekproef groot genoeg: np groter of gelijk aan 15 en n(1-p) groter of gelijk aan 15
• n = steekproefgrootte
• p = ware proportie
4. p moet kleiner zijn dan alfa, dan H0 verwerpen.
Stap 5: conclusie
- Significant?
- Wat betekent dat?
3
, Algemeen geval:
Toetsingsgrootheid > kritieke waarde = significant
Toetsingsgrootheid < kritieke waarde = niet significant
Significant → verwerp H0
Niet significant → verwerp H0 niet
Algemeen geval:
P-waarde < alfa = significant
P-waarde > alfa = niet significant
Significant → verwerp H0
Niet significant → verwerp H0 niet
Gemiddelde
Stap 1: Assumpties
- Steekproef willekeurig getrokken
- Kwantitatieve variabele
- Normaal verdeeld
- Soms: variatie in populatie bekend; meestal: variantie in populatie onbekend
• Eenzijdig: robuust tegen schending n is groter of gelijk dan 30
• Tweezijdig: altijd robuust
Hierbij is de SE gelijk aan de SE die gebruikt wordt
voor het betrouwbaarheidsinterval
Stap 4: P-waarde
- Wat is de kans dat we de gevonden of extremere waarde vinden als de nulhypothese
(H0) waar is?
Overschrijdingskans van de gevonden toetsingsgrootheid in de tabel opzoeken, met behulp
van kritieke waarde.
T-verdeling hangt af van het aantal vrijheidsgraden, df: df= n -1.
Stap 5: Conclusie
- Significant?
4
Toetsende statistiek wordt gebruikt om een uitspraak te doen over de populatie
- Op basis van beschrijvende statistieken in de steekproef
Met behulp van toetsende statistiek kan er antwoord gegeven worden op vragen als:
- Zijn vrouwen slimmer dan mannen?
- Zijn kinderen met broertjes en/of zusjes socialer dan kinderen zonder broertjes en/of
zusjes?
- Verhoogt de wiskundetraining studieprestatie?
- Zijn ouderen in de stad gelukkiger dan ouderen op het platteland?
Twee soorten toetsende statistieken
→ Schatten van populatieparameters op basis van gevonden gegevens in de steekproef
- Statistieken: puntschattingen en betrouwbaarheidsintervallen
→ Toetsen van hypothesen over populatieparameters op basis van de gevonden gegevens in
de steekproef
- Statistieken: toetsingsgegevens en -resultaten
Betrouwbaarheidsinterval
Inferentiële statistiek: steekproef → populatie
De populatieparameter heeft een vaste waarde (p)
- Er is een exact aantal studenten POW waarvan een exact aantal vrouwelijke
studenten
- Maar die aantallen zijn onbekend, dus p is onbekend
De steekproefwaarde kan gebruikt worden als een schatting (p met dakje) van de
populatieparameter
- Deze schatting kent een bepaalde onzekerheid
Stel: er zitten nu toevallig veel vrouwelijke studenten in de zaal
Dan is de gevonden proportie groter dan de proportie in de populatie.
Stel ook: we onderzoeken het aantal vrouwelijke studenten bij elk hoorcollege
Soms zijn er wat meer, soms wat minder vrouwen aanwezig
Gemiddeld over alle mogelijke steekproeven zal de gemiddelde steekproef waarde gelijk zijn
aan de werkelijke waarde gelijk zijn aan de werkelijke waarde in de populatie.
Betrouwbaarheidsinterval
- We gebruiken de gegevens in de steekproef om een schatting te maken van de
populatieparameter
- De precisie van deze schatting geven we aan met behulp van een
betrouwbaarheidsinterval (BI) (Confidence interval)
1
,Het betrouwbaarheidsinterval geeft ‘plausibele’ waarden voor de populatieparameter op
basis van:
- De puntschatting (gevonden proportie/gemiddelde/verschil etc)
- Kritieke grenzen behorend bij de toetsingsgrootheid (t, z, etc)
- Standaardfout van de puntschatting
- Houdbaarheid van de aannamen die je doet (bijv. normaliteit)
2
,Nulhypothesetoets
1. Assumpties
2. Hypothese (nulhypothese en alternatieve hypothese = zijn we geïnteresseerd)
3. Toetsingsgrootheid
4. P-waarde
5. Conclusie
Assumpties bij proporties
- Steekproef willekeurig getrokken
- Categorische variabele
- Steekproef groot genoeg: np groter of gelijk aan 15 en n(1-p) groter of gelijk aan 15
• n = steekproefgrootte
• p = ware proportie
4. p moet kleiner zijn dan alfa, dan H0 verwerpen.
Stap 5: conclusie
- Significant?
- Wat betekent dat?
3
, Algemeen geval:
Toetsingsgrootheid > kritieke waarde = significant
Toetsingsgrootheid < kritieke waarde = niet significant
Significant → verwerp H0
Niet significant → verwerp H0 niet
Algemeen geval:
P-waarde < alfa = significant
P-waarde > alfa = niet significant
Significant → verwerp H0
Niet significant → verwerp H0 niet
Gemiddelde
Stap 1: Assumpties
- Steekproef willekeurig getrokken
- Kwantitatieve variabele
- Normaal verdeeld
- Soms: variatie in populatie bekend; meestal: variantie in populatie onbekend
• Eenzijdig: robuust tegen schending n is groter of gelijk dan 30
• Tweezijdig: altijd robuust
Hierbij is de SE gelijk aan de SE die gebruikt wordt
voor het betrouwbaarheidsinterval
Stap 4: P-waarde
- Wat is de kans dat we de gevonden of extremere waarde vinden als de nulhypothese
(H0) waar is?
Overschrijdingskans van de gevonden toetsingsgrootheid in de tabel opzoeken, met behulp
van kritieke waarde.
T-verdeling hangt af van het aantal vrijheidsgraden, df: df= n -1.
Stap 5: Conclusie
- Significant?
4