Statistiek II – HC 1; de t-toets en de f-toets
Statistiek II:
• toetsende statistiek
• meervoudige/multipele en logistische regressive
• verdelingsvrije (non-parametrische) toetsen
Statistiek I:
• one-sample t-toets: één steekproefgemiddelde
• paired-samples t-toets = voor- en nameting in één groep (ook wel: t-toets voor
afhankelijke steekproeven)
Statistiek II
• independent samples t-toets = two-samples t-toets =
t-toets voor twee onafhankelijke steekproeven: gemiddelden in twee groepen
vergelijken
– Scores in ene groep zijn onafhankelijk van andere groep (andere personen)
– Beide groepen zijn aselecte steekproeven uit bepaalde populatie(s)
Statistiek I:
• one-sample t-toets: zijn daders van liquidaties gemiddeld jonger dan 20 jaar?
• paired-samples t-toets: zijn gedetineerden na afloop van de Kies voor Verandering
training meer gemotiveerd om te veranderen dan vóór de training?
Statistiek II:
• independent samples t-toets: plegen daders na een HALT maatregel minder delicten
dan vergelijkbare daders die geen HALT maatregel kregen? 1 groep wel HALT en 1
groep niet HALT.
Independent samples
- Kan op 2 manieren worden geselecteerd:
o Uit 1 populatie
o Uit 2 populaties
1. onafhankelijke steekproeven uit één populatie:
- trek steekproef (n proefpersonen) RANDOM
- verdeel proefpersonen at random over twee groepen
- geef elke groep zijn eigen interventie
- meet het gemiddelde voor elke groep
- toets het verschil tussen de gemiddelden (t-toets)
Wat betekent nu een eventueel (significant) verschil (wijkt zo erg af van 0)?
Voorbeeld: pleegt een groep criminele jongeren met HALT afdoening gemiddeld minder
recidivedelicten dan de groep die geen HALT heeft gekregen?
Effect kan dan worden verklaard door de behandeling.
, 2. onafhankelijke steekproeven uit twee populaties:
– trek 2 steekproeven, één uit elke populatie
– meet het gemiddelde voor elke groep
– toets het verschil tussen de gemiddelden
Wat betekent nu een eventueel verschil (wijkt af van H0=0, significant verschil)?
Voorbeeld: is de gemiddelde startleeftijd bij geweldsdaders hoger/lager dan bij
daders van vermogensdelicten?
Voorwaarden bij independent samples t-toets, kijken of dit zo is voordat je gaat toetsen
1. De twee steekproeven zijn onafhankelijk van elkaar getrokken (of de steekproef is
willekeurig verdeeld over de twee groepen), dus:
, Belangrijk dat de scores van de ene steekproef de andere scores niet beïnvloed
hebben (groepen mogen elkaar niet vertellen hoe het eraan toegaat)
2. De varianties (spreiding) van de twee populaties waaruit de steekproeven komen,
zijn gelijk: homogeniteit van variantie (homogeneity of variance). Gemiddelde HOEFT
NIET GELIJK TE ZIJN. Dit onderzoek je juist.
equal variances
assumed
T toets is vrij robuust, vooral robuust als aan assumpties wordt voldaan. F-toets totaal
niet. F-toets is gevoelig voor niet-normale verdelingen.
Keuzes bij t-toets
Eerst uitrekenen of varianties gelijk zijn met F-toets: zie formuleblad
Df: n1-1 in teller / n2-1 in noemer
Stappen independent samples t-toets
1. Nulhypothese
Verschil tussen populatiegemiddelden is onbekend, we gaan uit van de
nulhypothese dat μ1-μ2=0
2. Toetsstatistiek
Het verschil tussen gemiddelden omgezet in ‘standaard’ toetsstatistiek t-
score
, 3. Kritieke waarde
Is het verschil tussen verschil ‘μ1-μ2’ en ‘0’ significant? Hoe groot verschil
is genoeg om de nulhypothese te verwerpen?
T-toets bij σ = onbekend
Twee- of eenzijdig?
4. Beslissing
Bij een significant verschil veronderstellen we dat de gemiddelden uit
verschillende populaties komen (groter dan kritieke waarde)
1. Hypothese wordt:
H0: μ1 = μ2 ofwel H0: μ1 - μ2 = 0
H1: μ1 ≠ μ2 ofwel H1: μ1 - μ2 ≠ 0
2. Toetsstatistiek T: one sample t-test
Voor 2 onafhankelijke steekproeven:
• Onder de nulhypothese H0: μ1 = μ2 valt (μ1 – μ2 = 0) weg
• Voor de standaardfout gelden twee verschillende procedures:
equal variances assumed equal variances not assumed
Standaardfout als σ21 = σ22 (bij gelijke varianties, equal variances
assumed)
Als σ21 en σ22 gelijk zijn dan exacte t-verdeling
• Dus als s21 en s22 niet significant van elkaar verschillen
– Dan een gecombineerde schatter (pooled estimator) voor de
variantie
Statistiek II:
• toetsende statistiek
• meervoudige/multipele en logistische regressive
• verdelingsvrije (non-parametrische) toetsen
Statistiek I:
• one-sample t-toets: één steekproefgemiddelde
• paired-samples t-toets = voor- en nameting in één groep (ook wel: t-toets voor
afhankelijke steekproeven)
Statistiek II
• independent samples t-toets = two-samples t-toets =
t-toets voor twee onafhankelijke steekproeven: gemiddelden in twee groepen
vergelijken
– Scores in ene groep zijn onafhankelijk van andere groep (andere personen)
– Beide groepen zijn aselecte steekproeven uit bepaalde populatie(s)
Statistiek I:
• one-sample t-toets: zijn daders van liquidaties gemiddeld jonger dan 20 jaar?
• paired-samples t-toets: zijn gedetineerden na afloop van de Kies voor Verandering
training meer gemotiveerd om te veranderen dan vóór de training?
Statistiek II:
• independent samples t-toets: plegen daders na een HALT maatregel minder delicten
dan vergelijkbare daders die geen HALT maatregel kregen? 1 groep wel HALT en 1
groep niet HALT.
Independent samples
- Kan op 2 manieren worden geselecteerd:
o Uit 1 populatie
o Uit 2 populaties
1. onafhankelijke steekproeven uit één populatie:
- trek steekproef (n proefpersonen) RANDOM
- verdeel proefpersonen at random over twee groepen
- geef elke groep zijn eigen interventie
- meet het gemiddelde voor elke groep
- toets het verschil tussen de gemiddelden (t-toets)
Wat betekent nu een eventueel (significant) verschil (wijkt zo erg af van 0)?
Voorbeeld: pleegt een groep criminele jongeren met HALT afdoening gemiddeld minder
recidivedelicten dan de groep die geen HALT heeft gekregen?
Effect kan dan worden verklaard door de behandeling.
, 2. onafhankelijke steekproeven uit twee populaties:
– trek 2 steekproeven, één uit elke populatie
– meet het gemiddelde voor elke groep
– toets het verschil tussen de gemiddelden
Wat betekent nu een eventueel verschil (wijkt af van H0=0, significant verschil)?
Voorbeeld: is de gemiddelde startleeftijd bij geweldsdaders hoger/lager dan bij
daders van vermogensdelicten?
Voorwaarden bij independent samples t-toets, kijken of dit zo is voordat je gaat toetsen
1. De twee steekproeven zijn onafhankelijk van elkaar getrokken (of de steekproef is
willekeurig verdeeld over de twee groepen), dus:
, Belangrijk dat de scores van de ene steekproef de andere scores niet beïnvloed
hebben (groepen mogen elkaar niet vertellen hoe het eraan toegaat)
2. De varianties (spreiding) van de twee populaties waaruit de steekproeven komen,
zijn gelijk: homogeniteit van variantie (homogeneity of variance). Gemiddelde HOEFT
NIET GELIJK TE ZIJN. Dit onderzoek je juist.
equal variances
assumed
T toets is vrij robuust, vooral robuust als aan assumpties wordt voldaan. F-toets totaal
niet. F-toets is gevoelig voor niet-normale verdelingen.
Keuzes bij t-toets
Eerst uitrekenen of varianties gelijk zijn met F-toets: zie formuleblad
Df: n1-1 in teller / n2-1 in noemer
Stappen independent samples t-toets
1. Nulhypothese
Verschil tussen populatiegemiddelden is onbekend, we gaan uit van de
nulhypothese dat μ1-μ2=0
2. Toetsstatistiek
Het verschil tussen gemiddelden omgezet in ‘standaard’ toetsstatistiek t-
score
, 3. Kritieke waarde
Is het verschil tussen verschil ‘μ1-μ2’ en ‘0’ significant? Hoe groot verschil
is genoeg om de nulhypothese te verwerpen?
T-toets bij σ = onbekend
Twee- of eenzijdig?
4. Beslissing
Bij een significant verschil veronderstellen we dat de gemiddelden uit
verschillende populaties komen (groter dan kritieke waarde)
1. Hypothese wordt:
H0: μ1 = μ2 ofwel H0: μ1 - μ2 = 0
H1: μ1 ≠ μ2 ofwel H1: μ1 - μ2 ≠ 0
2. Toetsstatistiek T: one sample t-test
Voor 2 onafhankelijke steekproeven:
• Onder de nulhypothese H0: μ1 = μ2 valt (μ1 – μ2 = 0) weg
• Voor de standaardfout gelden twee verschillende procedures:
equal variances assumed equal variances not assumed
Standaardfout als σ21 = σ22 (bij gelijke varianties, equal variances
assumed)
Als σ21 en σ22 gelijk zijn dan exacte t-verdeling
• Dus als s21 en s22 niet significant van elkaar verschillen
– Dan een gecombineerde schatter (pooled estimator) voor de
variantie