Hoorcollege 8
Verschil in gemiddelden = meeteenheid afhankelijk
toetsingsgrootheid = t
Verschillen tussen 2 gemiddeldes (M1-M2) gedeeld door standaardfout (SE)
standaardfout (SE) = maat die aangeeft hoe ver de schattingen van een
steekproefgemiddelde waarschijnlijk afwijken van het werkelijke populatiegemiddelde. (hoe
nauwkeurig je steekproef de populatie representeert)
standaardafwijking = mate van spreiding in data
Veel spreiding in scores (standaardafwijking) → waarde boven streep groter →
standaardfout ook groter
Als steekproeven (SD) groter worden → standaardfout kleiner (smallere verdeling want
nauwkeurigere metingen) → relatieve verschil wordt groter
Een groter verschil in gemiddelden → grotere t
Meer spreiding → kleinere t
Stappen NHST
1. Formuleren van hypothesen
2. Keuze & berekenen van een toetsingsgrootheid
3. Kans bepalen op resultaat of nog extremer gegeven H0
4. Beslissing nemen over H0
(wel of niet verwerpen)
5. (Extra) Conclusie opschrijven
stap 1: hypothesen formuleren
- zijn altijd stellingen over de populatie (gemiddelde μ)
- wat is de nulhypothese en wat is de statistische hypothese
stap 2: toetsingsgrootheid
, stap 3:
stap 4: beslissing nemen over H0 (nulhypothese wel of niet verwerpen)
kleine p-waarde → weinig ondersteuning → nulhypothese verwerpen
grote p-waarde → grote ondersteuning → nulhypothese niet verwerpen
wanneer is p-waarde klein / niet klein? is er een grens?
BIJV: p-waarde van 0.025 = wanneer er herhaaldelijk steekproeven getrokken worden en de
nulhypothese waar is, is er in 2,5% van de keren resultaten gevonden worden die gelijk zijn
aan de resultaten in het huidige onderzoek of resultaten nog extremer (nog verder van 0).
p-waarde hangt af van de resultaten van je onderzoek, is een resultaat.
Het is mogelijk dat de nulhypothese toch waar is, (onderzoek is probabilistisch, gebaseerd
op kansen) ookal heeft de onderzoeker de nulhypothese verworpen.
→ FOUT TYPE 1: foutief verwerpen van nulhypothese; we kunnen niet voorkomen dat
we deze fout maken. we kunnen de kans wel kleiner maken, klein genoeg.
→ = grenswaarde die we gebruiken of p-waarde klein of groot is.
= α (alfa, vaak .05) = kans op type 1 fout = het significantieniveau
.05 = prima om een kans van 5% toe te staan om type 1 fout te maken = acceptabel
(vaak in sociale wetenschappen, verschilt per wetenschap) = significant
significante resultaten: p-waarde < α
niet-significante resultaten: p-waarde > α
Type II fout = foutief niet-verwerpen van nulhypothese:
onderzoekers concluderen dat er geen verschil is tussen twee groepen terwijl die er in
werkelijkheid wel is
onderscheidingsvermogen (power) = als nulhypothese niet waar is, dan willen
onderzoekers mogen concluderen dat deze inderdaad niet waar is = kans op het juist
verwerpen van nulhypothese = 1 - β
De power meet de kans dat een bepaald verschil in de populatie ook gevonden wordt aan
de hand van de steekproefdata en de statistische toets.
alfa en beta zijn niet direct gerelateerd, maar wel indirect, als de ene groter wordt, wordt de
ander kleiner.
grote alfa → hogere power
Onderzoeker moet een balans zoeken tussen de waarde van alfa en de power.
Hoorcollege 9
Om relevantie te bepalen → maat van effectgrootte = cohens d
Statistische validiteit
▪ Significantie wordt bepaald aan de hand van de toetsingsgrootheid
Verschil in gemiddelden = meeteenheid afhankelijk
toetsingsgrootheid = t
Verschillen tussen 2 gemiddeldes (M1-M2) gedeeld door standaardfout (SE)
standaardfout (SE) = maat die aangeeft hoe ver de schattingen van een
steekproefgemiddelde waarschijnlijk afwijken van het werkelijke populatiegemiddelde. (hoe
nauwkeurig je steekproef de populatie representeert)
standaardafwijking = mate van spreiding in data
Veel spreiding in scores (standaardafwijking) → waarde boven streep groter →
standaardfout ook groter
Als steekproeven (SD) groter worden → standaardfout kleiner (smallere verdeling want
nauwkeurigere metingen) → relatieve verschil wordt groter
Een groter verschil in gemiddelden → grotere t
Meer spreiding → kleinere t
Stappen NHST
1. Formuleren van hypothesen
2. Keuze & berekenen van een toetsingsgrootheid
3. Kans bepalen op resultaat of nog extremer gegeven H0
4. Beslissing nemen over H0
(wel of niet verwerpen)
5. (Extra) Conclusie opschrijven
stap 1: hypothesen formuleren
- zijn altijd stellingen over de populatie (gemiddelde μ)
- wat is de nulhypothese en wat is de statistische hypothese
stap 2: toetsingsgrootheid
, stap 3:
stap 4: beslissing nemen over H0 (nulhypothese wel of niet verwerpen)
kleine p-waarde → weinig ondersteuning → nulhypothese verwerpen
grote p-waarde → grote ondersteuning → nulhypothese niet verwerpen
wanneer is p-waarde klein / niet klein? is er een grens?
BIJV: p-waarde van 0.025 = wanneer er herhaaldelijk steekproeven getrokken worden en de
nulhypothese waar is, is er in 2,5% van de keren resultaten gevonden worden die gelijk zijn
aan de resultaten in het huidige onderzoek of resultaten nog extremer (nog verder van 0).
p-waarde hangt af van de resultaten van je onderzoek, is een resultaat.
Het is mogelijk dat de nulhypothese toch waar is, (onderzoek is probabilistisch, gebaseerd
op kansen) ookal heeft de onderzoeker de nulhypothese verworpen.
→ FOUT TYPE 1: foutief verwerpen van nulhypothese; we kunnen niet voorkomen dat
we deze fout maken. we kunnen de kans wel kleiner maken, klein genoeg.
→ = grenswaarde die we gebruiken of p-waarde klein of groot is.
= α (alfa, vaak .05) = kans op type 1 fout = het significantieniveau
.05 = prima om een kans van 5% toe te staan om type 1 fout te maken = acceptabel
(vaak in sociale wetenschappen, verschilt per wetenschap) = significant
significante resultaten: p-waarde < α
niet-significante resultaten: p-waarde > α
Type II fout = foutief niet-verwerpen van nulhypothese:
onderzoekers concluderen dat er geen verschil is tussen twee groepen terwijl die er in
werkelijkheid wel is
onderscheidingsvermogen (power) = als nulhypothese niet waar is, dan willen
onderzoekers mogen concluderen dat deze inderdaad niet waar is = kans op het juist
verwerpen van nulhypothese = 1 - β
De power meet de kans dat een bepaald verschil in de populatie ook gevonden wordt aan
de hand van de steekproefdata en de statistische toets.
alfa en beta zijn niet direct gerelateerd, maar wel indirect, als de ene groter wordt, wordt de
ander kleiner.
grote alfa → hogere power
Onderzoeker moet een balans zoeken tussen de waarde van alfa en de power.
Hoorcollege 9
Om relevantie te bepalen → maat van effectgrootte = cohens d
Statistische validiteit
▪ Significantie wordt bepaald aan de hand van de toetsingsgrootheid