Samenvatting ECO
Week 1: Correlaties en maten voor effectgrootte
Correlatie: is er een samenhang tussen twee variabelen? Causaliteit: is er een effect? Covariantie:
variabelen moeten samenhangen. Directionaliteit: oorzaak gaat vooraf aan gevolg. Interne validiteit:
alternatieve verklaringen uitgesloten.
Scatterplots: kijken naar richting (positief vs negatief), sterkte, vorm (lineair/niet lineair en
homogeen/heterogeen), uitbijters (punten die ver van anderen liggen, hebben groot effect op
correlatie.)
∑( xi−x )( yi− y )
Covariantie (Sxy): de mate waarin twee variabelen samen variëren. Sxy= . Geeft
N−1
informatie over sterkte en richting van samenhang. Nadeel: moeilijk interpreteren. Oplossing:
standaardiseer de covariantie.
Pearson Product-Moment Correlatie (r): Pearson r is een gestandaardiseerde maat die lineaire
Sxy
verband beschrijft tussen twee kwantitatieve variabelen. Waade ligt altijd tussen -1 en +1. r = of
SxSy
r z=
∑ Z xZy . Voordeel: makkelijker interpreteren, want niet afhankelijk van meeteenheid. Pas op
N−1
voor niet-lineaire verbanden, uitbijters, heterogene subgroepen, range.
Alternatieve correlatiecoëfficiënten:
Kwantitatief + Kwantitatief Pearson r
Ordinaal + Ordinaal Spearman’s rho (Rs)
Dichotoom + Kwantitatief Punt-biseriële correlatie (Rpb)
Dichotoom + Dichotoom Phi coëfficiënt ()
Spearman’s rho (Rs) beschrijft samenhang tussen twee ordinale/gerangorderdende variabelen.
Wanneer scores nog geen rangscores zijn, dan omzetten in rangnummers. Gebruik Pearson
correlatieformule om Rs te berekenen. Is robuuste variant van Pearson r bij uitbijters en/of zwakke
niet-lineairiteit.
Punt-biseriële correlatie (rpb) beschrijft samenhang tussen kwantitatieve en dichotome variabele.
√
2
t
Gebruik Pearson correlatieformule om Rpb te berekenen. r pb= 2
t + df
Phi-coëfficiënt () beschrijft samenhang tussen twee dichotome variabelen. Gebruik Pearson
correlatieformule om te berekenen. Maar ook te berekenen met kruistabel:
√
AD−BC χ2
Φ= . Relatie en 2: Φ= ↔ χ 2=Φ2∗N .
√( A+ B )( C+ D ) (A +C)(B+ D) N
1
, X=0 X=1 Total
Y=0 A B A+B
Y=1 C D C+D
Total A+C B+D A+B+C+D=N
Significantietoetsing van r R, Rs, Rpb en zeggen iets over samenhang in steekproef. Wat zeggen
ze over correlatie in populatie (). Hypothesen ( = 0; ≠ 0). T-toes voor significantie van r:
r √ N −2
t= . Met df = N – 2.
√1−r 2
Vuistregels effectgrootte (Cohen, 1977):
r// r2 rpb r2pb
Small .10 .01 .10 .01
Medium .30 .09 .24 .06
Large .50 .25 .37 .14
Week 2: Enkelvoudige Lineaire analyses
Een correlatie beschrijft het lineaire tussen twee (interval) variabelen. Een regressie maakt het
mogelijk om de ene variabele uit een andere te voorspellen.
1) Eén predictor (onafhankelijke) variabele X 1 predictorvariabele = enkelvoudige
lineaire regressie. 2 predictorvariabelen = meervoudige lineaire regressie.
2) Eén respons/criterium variabele Y.
Ongestandaardiseerde regressievergelijking: ^y =b0 +b1 x . B0 = intercept/constante. B1 =
helling/slope.
Kleinste kwadratenprincipe error/residu (ei) = geobserveerde waarde (yi) – voorspelde waarde
(ŷi). Best passende lijn als error ∑ e2i minimaal is. Regressievergelijking – coëfficiënten
sy
b 0= y−b1 x ; b 1=r . Bij het tekenen van een regressie lijn gaat deze altijd door de punten (0, b 0) en
sx
(x̅, ȳ).
Interpretatie = voorspelling maken binnen range van X en Y. Extrapolatie = voorspelling maken
buiten range van X en Y.
Gestandaardiseerde regressievergelijking ^z y =rz x
SS e ∑ ( y− ^y )2
Standaardfout van de voorspelling residual/error variance MS e = = p = aantal
df e N −p−1
predictoren. Standaardfout van voorspelling: Se =√ MS e. Lagere waarden Se wijzen op betere fit. Hoe
hoger Se, hoe minder goed het model.
2
Week 1: Correlaties en maten voor effectgrootte
Correlatie: is er een samenhang tussen twee variabelen? Causaliteit: is er een effect? Covariantie:
variabelen moeten samenhangen. Directionaliteit: oorzaak gaat vooraf aan gevolg. Interne validiteit:
alternatieve verklaringen uitgesloten.
Scatterplots: kijken naar richting (positief vs negatief), sterkte, vorm (lineair/niet lineair en
homogeen/heterogeen), uitbijters (punten die ver van anderen liggen, hebben groot effect op
correlatie.)
∑( xi−x )( yi− y )
Covariantie (Sxy): de mate waarin twee variabelen samen variëren. Sxy= . Geeft
N−1
informatie over sterkte en richting van samenhang. Nadeel: moeilijk interpreteren. Oplossing:
standaardiseer de covariantie.
Pearson Product-Moment Correlatie (r): Pearson r is een gestandaardiseerde maat die lineaire
Sxy
verband beschrijft tussen twee kwantitatieve variabelen. Waade ligt altijd tussen -1 en +1. r = of
SxSy
r z=
∑ Z xZy . Voordeel: makkelijker interpreteren, want niet afhankelijk van meeteenheid. Pas op
N−1
voor niet-lineaire verbanden, uitbijters, heterogene subgroepen, range.
Alternatieve correlatiecoëfficiënten:
Kwantitatief + Kwantitatief Pearson r
Ordinaal + Ordinaal Spearman’s rho (Rs)
Dichotoom + Kwantitatief Punt-biseriële correlatie (Rpb)
Dichotoom + Dichotoom Phi coëfficiënt ()
Spearman’s rho (Rs) beschrijft samenhang tussen twee ordinale/gerangorderdende variabelen.
Wanneer scores nog geen rangscores zijn, dan omzetten in rangnummers. Gebruik Pearson
correlatieformule om Rs te berekenen. Is robuuste variant van Pearson r bij uitbijters en/of zwakke
niet-lineairiteit.
Punt-biseriële correlatie (rpb) beschrijft samenhang tussen kwantitatieve en dichotome variabele.
√
2
t
Gebruik Pearson correlatieformule om Rpb te berekenen. r pb= 2
t + df
Phi-coëfficiënt () beschrijft samenhang tussen twee dichotome variabelen. Gebruik Pearson
correlatieformule om te berekenen. Maar ook te berekenen met kruistabel:
√
AD−BC χ2
Φ= . Relatie en 2: Φ= ↔ χ 2=Φ2∗N .
√( A+ B )( C+ D ) (A +C)(B+ D) N
1
, X=0 X=1 Total
Y=0 A B A+B
Y=1 C D C+D
Total A+C B+D A+B+C+D=N
Significantietoetsing van r R, Rs, Rpb en zeggen iets over samenhang in steekproef. Wat zeggen
ze over correlatie in populatie (). Hypothesen ( = 0; ≠ 0). T-toes voor significantie van r:
r √ N −2
t= . Met df = N – 2.
√1−r 2
Vuistregels effectgrootte (Cohen, 1977):
r// r2 rpb r2pb
Small .10 .01 .10 .01
Medium .30 .09 .24 .06
Large .50 .25 .37 .14
Week 2: Enkelvoudige Lineaire analyses
Een correlatie beschrijft het lineaire tussen twee (interval) variabelen. Een regressie maakt het
mogelijk om de ene variabele uit een andere te voorspellen.
1) Eén predictor (onafhankelijke) variabele X 1 predictorvariabele = enkelvoudige
lineaire regressie. 2 predictorvariabelen = meervoudige lineaire regressie.
2) Eén respons/criterium variabele Y.
Ongestandaardiseerde regressievergelijking: ^y =b0 +b1 x . B0 = intercept/constante. B1 =
helling/slope.
Kleinste kwadratenprincipe error/residu (ei) = geobserveerde waarde (yi) – voorspelde waarde
(ŷi). Best passende lijn als error ∑ e2i minimaal is. Regressievergelijking – coëfficiënten
sy
b 0= y−b1 x ; b 1=r . Bij het tekenen van een regressie lijn gaat deze altijd door de punten (0, b 0) en
sx
(x̅, ȳ).
Interpretatie = voorspelling maken binnen range van X en Y. Extrapolatie = voorspelling maken
buiten range van X en Y.
Gestandaardiseerde regressievergelijking ^z y =rz x
SS e ∑ ( y− ^y )2
Standaardfout van de voorspelling residual/error variance MS e = = p = aantal
df e N −p−1
predictoren. Standaardfout van voorspelling: Se =√ MS e. Lagere waarden Se wijzen op betere fit. Hoe
hoger Se, hoe minder goed het model.
2