ALGEMEEN
Bij het gebruik van een t-toets, altijd p-waarde x2 doen!
Modellen met kwantitatieve en meerdere kwalitatieve variabelen: Speciale
predictoren
o Je gebruikt dan dummyvariabelen om de kwalitatieve variabelen te
verwerken in het regressiemodel
Modellen met enkel kwalitatieve variabelen: ANOVA-modellen
o Je bekijkt of de gemiddelden van groepen (op basis van categorische
variabelen) verschillen
Modellen met kwalitatieve én kwantitatieve variabelen, waarbij de kwalitatieve
van primair belang zijn: ANCOVA-modellen
o Je onderzoekt groepsverschillen (categorische variabelen), maar je houdt
tegelijk rekening met één of meerdere kwantitatieve variabelen
(covariaten) die invloed kunnen hebben op de uitkomst
H1: INFERENTIE VOOR HET VERGELIJKEN VAN 2
POPULATIEGEMIDDELDEN
Hoe groter de steekproef, hoe kleiner de p-waarde
idd in de formules = observaties zijn onafhankelijk en komen uit dezelfde
verdeling
e = epsilon = residu of de voorspellingsfout, het is de individuele afwijking en
geeft aan hoe ver een score boven of onder het gemiddelde ligt (+/- = hoog of
laag en >/< = ver of dicht ervan af)
Beperkt model = twee dezelfde verdelingen, met hetzelfde gemiddelde en
dezelfde standaardafwijking
Uitgebreid model = verschillende verdelingen voor verschillende condities met
elk een ander gemiddelde maar een gelijkaardige standaardafwijking.
Steekproefschatter = verschil tussen 2 steekproefgemiddelden (Y2 – Y1)
Pagina 1 van 55
,STAPPENPLAN:
Stap 1: Hypothesen en Modellen
Stap 2: Toetsstatistiek (t-toets)
Stap 3: p-waarde Tabel D tweezijdig dus px2
o P < a = Ho verwerpen = significant
o P > a = Ho aanvaarden = niet significant
Stap 4: Effectgrootte
o T* bij 95% bv = kijken op alfa niveau 0,025
H2: ANOVA 1 ~ VARIANTIE-ANALYSE MET ÉÉN FACTOR
= er is ergens een verschil tussen de groepen
SSerror beperkt = maat voor te verklaren variantie
SSerror uitgebreid = maat voor niet-verklaarde variantie
o De onverklaarde variabiliteit (binnengroepsvariabiliteit)
SSeffect = maat voor verklaarde variantie
o = De variabiliteit verklaard door de factor (tussengroepsvariabiliteit)
Uitbijters zijn problematisch voor ANOVA want ze halen het gemiddelde sterk
naar beneden of naar boven en we werken hier enkel met gemiddeldes dus dat is
problematisch
Pagina 2 van 55
, Vrijheidsgraden van het beperkt model zijn groter dan die van het uitgebreid
model
TOETSSTATISTIEK: Vergelijken van adequaatheid van beide modellen
o Fit: Hoe goed passen de modellen bij de gegevens en hoe goed
omschrijven ze de data?
o Complexiteit: Beperkt model is minder complex want daar is er maar 1
verdeling, uitgebreid heeft er meer, en hier zal de fit beter zijn omdat we
zo ook bv. 8 u’s hebben.
o Functie van de toetsstatistiek = wat is de beste balans tussen fit en
complexiteit?
Horizontale streepjes geven de conditie specifieke gemiddelden weer (kleur per
conditie)
Voorspellingsfouten: verschil tussen score en gemiddelde
o Beperkt model: verschil met algemeen gemiddelde (rode pijl)
o Uitgebreid model: verschil met conditie specifiek gemiddelden (blauwe pijl)
Pagina 3 van 55
, Assumpties:
Normaliteit = scores zijn normaal verdeeld in elke conditie
Onafhankelijkheid = elke persoon is onafhankelijk getrokken
o Cluster-effecten: observaties in clusters waarbij de observaties uit
dezelfde cluster meer op elkaar lijken dan observaties uit verschillende
clusters
o Seriële effecten: personen zijn herhaaldelijk gemeten, waarbij
opeenvolgende metingen samenhangen (over een jaar, 7 metingen doen
bv.)
Homoscedasticiteit = gelijke populatie-standaardafwijkingen binnen de groepen
(<-> heteroscedasticiteit)
ANOVA is niet robuust tegen uitbijters (uitbijters zijn dus problematisch bij ANOVA)
Pagina 4 van 55
Bij het gebruik van een t-toets, altijd p-waarde x2 doen!
Modellen met kwantitatieve en meerdere kwalitatieve variabelen: Speciale
predictoren
o Je gebruikt dan dummyvariabelen om de kwalitatieve variabelen te
verwerken in het regressiemodel
Modellen met enkel kwalitatieve variabelen: ANOVA-modellen
o Je bekijkt of de gemiddelden van groepen (op basis van categorische
variabelen) verschillen
Modellen met kwalitatieve én kwantitatieve variabelen, waarbij de kwalitatieve
van primair belang zijn: ANCOVA-modellen
o Je onderzoekt groepsverschillen (categorische variabelen), maar je houdt
tegelijk rekening met één of meerdere kwantitatieve variabelen
(covariaten) die invloed kunnen hebben op de uitkomst
H1: INFERENTIE VOOR HET VERGELIJKEN VAN 2
POPULATIEGEMIDDELDEN
Hoe groter de steekproef, hoe kleiner de p-waarde
idd in de formules = observaties zijn onafhankelijk en komen uit dezelfde
verdeling
e = epsilon = residu of de voorspellingsfout, het is de individuele afwijking en
geeft aan hoe ver een score boven of onder het gemiddelde ligt (+/- = hoog of
laag en >/< = ver of dicht ervan af)
Beperkt model = twee dezelfde verdelingen, met hetzelfde gemiddelde en
dezelfde standaardafwijking
Uitgebreid model = verschillende verdelingen voor verschillende condities met
elk een ander gemiddelde maar een gelijkaardige standaardafwijking.
Steekproefschatter = verschil tussen 2 steekproefgemiddelden (Y2 – Y1)
Pagina 1 van 55
,STAPPENPLAN:
Stap 1: Hypothesen en Modellen
Stap 2: Toetsstatistiek (t-toets)
Stap 3: p-waarde Tabel D tweezijdig dus px2
o P < a = Ho verwerpen = significant
o P > a = Ho aanvaarden = niet significant
Stap 4: Effectgrootte
o T* bij 95% bv = kijken op alfa niveau 0,025
H2: ANOVA 1 ~ VARIANTIE-ANALYSE MET ÉÉN FACTOR
= er is ergens een verschil tussen de groepen
SSerror beperkt = maat voor te verklaren variantie
SSerror uitgebreid = maat voor niet-verklaarde variantie
o De onverklaarde variabiliteit (binnengroepsvariabiliteit)
SSeffect = maat voor verklaarde variantie
o = De variabiliteit verklaard door de factor (tussengroepsvariabiliteit)
Uitbijters zijn problematisch voor ANOVA want ze halen het gemiddelde sterk
naar beneden of naar boven en we werken hier enkel met gemiddeldes dus dat is
problematisch
Pagina 2 van 55
, Vrijheidsgraden van het beperkt model zijn groter dan die van het uitgebreid
model
TOETSSTATISTIEK: Vergelijken van adequaatheid van beide modellen
o Fit: Hoe goed passen de modellen bij de gegevens en hoe goed
omschrijven ze de data?
o Complexiteit: Beperkt model is minder complex want daar is er maar 1
verdeling, uitgebreid heeft er meer, en hier zal de fit beter zijn omdat we
zo ook bv. 8 u’s hebben.
o Functie van de toetsstatistiek = wat is de beste balans tussen fit en
complexiteit?
Horizontale streepjes geven de conditie specifieke gemiddelden weer (kleur per
conditie)
Voorspellingsfouten: verschil tussen score en gemiddelde
o Beperkt model: verschil met algemeen gemiddelde (rode pijl)
o Uitgebreid model: verschil met conditie specifiek gemiddelden (blauwe pijl)
Pagina 3 van 55
, Assumpties:
Normaliteit = scores zijn normaal verdeeld in elke conditie
Onafhankelijkheid = elke persoon is onafhankelijk getrokken
o Cluster-effecten: observaties in clusters waarbij de observaties uit
dezelfde cluster meer op elkaar lijken dan observaties uit verschillende
clusters
o Seriële effecten: personen zijn herhaaldelijk gemeten, waarbij
opeenvolgende metingen samenhangen (over een jaar, 7 metingen doen
bv.)
Homoscedasticiteit = gelijke populatie-standaardafwijkingen binnen de groepen
(<-> heteroscedasticiteit)
ANOVA is niet robuust tegen uitbijters (uitbijters zijn dus problematisch bij ANOVA)
Pagina 4 van 55