Statistische modellen 2
Inhoudsopgave
College 1 .......................................................................................................................................................... 1
Wanneer welk model? ........................................................................................................................................ 1
Regressieanalyse ................................................................................................................................................ 2
Multiple regressie ............................................................................................................................................... 4
College 2 .......................................................................................................................................................... 6
Multivariate relaties ........................................................................................................................................... 7
Mediatieanalyse ................................................................................................................................................. 8
College 3 ........................................................................................................................................................ 10
Eenwegvariantieanalyse .................................................................................................................................. 11
Tweewegvariantie ............................................................................................................................................ 13
College 4 ........................................................................................................................................................ 15
College 5 ........................................................................................................................................................ 18
T-toets als regressiemodel
.......................................................................................................................................................................... 20
ANOVA als regressiemodel ............................................................................................................................... 21
College 6 logistische regressieanalyse ............................................................................................................ 22
Odds ................................................................................................................................................................. 24
Odds ratio ......................................................................................................................................................... 24
College 7 Repeated measures ANOVA ............................................................................................................ 25
College 1
Wanneer welk model?
Onafh. Afh.
X1 X2 Y Model
DUM INT t-toets voor onafhankelijke groepen
NOM INT éénwegvariantieanalyse (ANOVA)
NOM NOM INT tweewegvariantieanalyse (ANOVA)
INT INT enkelvoudige regressieanalyse
INT INT INT multipele regressieanalyse
INT NOM INT covariantieanalyse
,INT DUM DUM logistische regressieanalyse
Afh.
Y1 Y2 Y3 Model
INT INT t-toets voor gepaarde waarnemingen
INT INT INT repeated measures ANOVA
Regressieanalyse
INT= intervalvariabelen: deze kunnen heel veel verschillende waardes aannemen. Bijv:
- lengte
- gewicht
- attitude (schaal)
- coping (schaal)
- vaardigheidsscores (bijv taaltoets)
(bij een schaal vanaf 7 categorieën gebruik je sowieso een interval)
Met een regressieanalyse kijk je naar hoe variabelen gerelateerd zijn.
Door middel van een spreidingsdiagram kijk je hoe de variabelen gerelateerd zijn. Als het
enigszins lineair is kan je aannemen dat het helemaal lineair zijn: dan is het proportioneel
gerelateerd: bijv 2 opzij is altijd 1 omhoog.
De lijn geeft de kleinste kwadratensom van de residuen weer.
Met kleinste kwadratenlijn kunnen we nu een aantal vragen beantwoorden
Onderzoeksvraag 1
Is er een lineaire relatie tussen BDI en coping in de populatie?
(Pearson)
Door middel van een t-toets (H0, Ha)
P<0,001 → verwerp H0: significante relatie
Onderzoeksvraag 2
Hoe sterk is de lineaire relatie tussen BDI en coping?
1 en 2 → Pearson correlatie
Kwadraat van de correlatie: gemeenschappelijke variantie tussen variabelen
Onderzoeksvraag 3
Kan BDI voorspeld worden door coping?
→ Enkelvoudige regressieanalyse (= regressieanalyse met één voorspeller)
Met 1 X en 1 Y
yi = β0 + β1xi + i
Y= data
B= model
, E= error
B0= intercept
B1= helling/slope
E= residu/afwijking/error
B0 en B1 moeten worden geschat op basis van de steekproef
Als B in griekse letter staat is het de populatie, in een gewone letter is het de geschatte beta.
Het model laat spreiding toe: het is dus niet nodig dat alle
punten precies op de lijn liggen. Maar ze moeten wel
homoscedastisch zijn: de verticale spreiding is voor alle
waarden van X ongeveer gelijk.
B bij Constant: intercept
B bij coping: helling
→ geschatte regressievergelijking:
BDI= 54,297 – 5,2*coping
H0: B0=0
Sig <0,001 → het intercept is zeer waarschijnlijk niet 0 in de populatie
Bij gestandaardiseerde coëfficienten is er een gelijke spreiding.
+ gemiddelde 0 en st dev 1 → gemiddelde 0= intercept 0
Hoe sterk is het model?
R= multiple correlatie
R^2= verklaarde variantie van Y
Kleine residuen= hoge correlatie= meer verklaarde variantie
Assumpties regressieanalyse:
1. Relatie y en x1, x2, x3 en x4 is lineair - model veronderstelt een lineaire
relatie (regressievergelijking)
2. Residuen normaal verdeeld met gemiddelde 0
Inhoudsopgave
College 1 .......................................................................................................................................................... 1
Wanneer welk model? ........................................................................................................................................ 1
Regressieanalyse ................................................................................................................................................ 2
Multiple regressie ............................................................................................................................................... 4
College 2 .......................................................................................................................................................... 6
Multivariate relaties ........................................................................................................................................... 7
Mediatieanalyse ................................................................................................................................................. 8
College 3 ........................................................................................................................................................ 10
Eenwegvariantieanalyse .................................................................................................................................. 11
Tweewegvariantie ............................................................................................................................................ 13
College 4 ........................................................................................................................................................ 15
College 5 ........................................................................................................................................................ 18
T-toets als regressiemodel
.......................................................................................................................................................................... 20
ANOVA als regressiemodel ............................................................................................................................... 21
College 6 logistische regressieanalyse ............................................................................................................ 22
Odds ................................................................................................................................................................. 24
Odds ratio ......................................................................................................................................................... 24
College 7 Repeated measures ANOVA ............................................................................................................ 25
College 1
Wanneer welk model?
Onafh. Afh.
X1 X2 Y Model
DUM INT t-toets voor onafhankelijke groepen
NOM INT éénwegvariantieanalyse (ANOVA)
NOM NOM INT tweewegvariantieanalyse (ANOVA)
INT INT enkelvoudige regressieanalyse
INT INT INT multipele regressieanalyse
INT NOM INT covariantieanalyse
,INT DUM DUM logistische regressieanalyse
Afh.
Y1 Y2 Y3 Model
INT INT t-toets voor gepaarde waarnemingen
INT INT INT repeated measures ANOVA
Regressieanalyse
INT= intervalvariabelen: deze kunnen heel veel verschillende waardes aannemen. Bijv:
- lengte
- gewicht
- attitude (schaal)
- coping (schaal)
- vaardigheidsscores (bijv taaltoets)
(bij een schaal vanaf 7 categorieën gebruik je sowieso een interval)
Met een regressieanalyse kijk je naar hoe variabelen gerelateerd zijn.
Door middel van een spreidingsdiagram kijk je hoe de variabelen gerelateerd zijn. Als het
enigszins lineair is kan je aannemen dat het helemaal lineair zijn: dan is het proportioneel
gerelateerd: bijv 2 opzij is altijd 1 omhoog.
De lijn geeft de kleinste kwadratensom van de residuen weer.
Met kleinste kwadratenlijn kunnen we nu een aantal vragen beantwoorden
Onderzoeksvraag 1
Is er een lineaire relatie tussen BDI en coping in de populatie?
(Pearson)
Door middel van een t-toets (H0, Ha)
P<0,001 → verwerp H0: significante relatie
Onderzoeksvraag 2
Hoe sterk is de lineaire relatie tussen BDI en coping?
1 en 2 → Pearson correlatie
Kwadraat van de correlatie: gemeenschappelijke variantie tussen variabelen
Onderzoeksvraag 3
Kan BDI voorspeld worden door coping?
→ Enkelvoudige regressieanalyse (= regressieanalyse met één voorspeller)
Met 1 X en 1 Y
yi = β0 + β1xi + i
Y= data
B= model
, E= error
B0= intercept
B1= helling/slope
E= residu/afwijking/error
B0 en B1 moeten worden geschat op basis van de steekproef
Als B in griekse letter staat is het de populatie, in een gewone letter is het de geschatte beta.
Het model laat spreiding toe: het is dus niet nodig dat alle
punten precies op de lijn liggen. Maar ze moeten wel
homoscedastisch zijn: de verticale spreiding is voor alle
waarden van X ongeveer gelijk.
B bij Constant: intercept
B bij coping: helling
→ geschatte regressievergelijking:
BDI= 54,297 – 5,2*coping
H0: B0=0
Sig <0,001 → het intercept is zeer waarschijnlijk niet 0 in de populatie
Bij gestandaardiseerde coëfficienten is er een gelijke spreiding.
+ gemiddelde 0 en st dev 1 → gemiddelde 0= intercept 0
Hoe sterk is het model?
R= multiple correlatie
R^2= verklaarde variantie van Y
Kleine residuen= hoge correlatie= meer verklaarde variantie
Assumpties regressieanalyse:
1. Relatie y en x1, x2, x3 en x4 is lineair - model veronderstelt een lineaire
relatie (regressievergelijking)
2. Residuen normaal verdeeld met gemiddelde 0