Experimenteel en correlationeel onderzoek
College 1 – maandag 1 feb
Correlatie is geen causatie
Correlatie beschrijft het lineaire verband tussen twee (interval) variabelen.
1. Covariantie variabelen moeten samenhangen
2. Directionaliteit oorzaak gaat vooraf aan gevolg
3. Interne validiteit alternatieve verklaringen uitgesloten
Scatterplot;
- Richting positief vs negatief
- Sterkte hoe meer de punten op een rechte lijn liggen hoe sterker het
verband.
- Vorm lineair/niet lineair of homogeen/heterogeen
- Uitbijters punten die ver van de andere liggen
Covariantie (Sxy) = de mate waarin twee variabelen samen variëren
Formule in schrift
Covariantie geeft informatie over de sterkte en de richting van de samenhang
Nadeel moeilijk te interpreteren, want de waarde is afhankelijk van de
meeteenheid
Oplossing standaardiseren
Pearson r is een gestandaardiseerde maat die het lineaire verband beschrijft tussen
twee kwantitatieve variabelen en waarvan de waarde altijd tussen -1 en +1 ligt.
Voordeel makkelijker te interpreteren want de waarde is niet afhankelijk van de
meeteenheid
Scatterplot moet lineair zijn voor gebruik van pearson r
Oppassen voor;
- Niet-lineaire verbanden
- Uitbijters
- Heterogene subgroepen
- Restriction of range
Correlatiecoëfficiënten;
Kwantitatief + kwantitatief pearson r
Ordinaal + ordinaal spearman’s rho
Dichotoom + kwantitatief punt-biseriële correlatie
Dichotoom + dichotoom phi coëfficient
Spearman’s rho (Rs)
Beschrijft samenhang tussen twee ordinale/gerangordende variabelen
Wanneer scores nog geen rangscores zijn; zet scores om in rangnummers.
Dan; gebruik Pearson correlatieformule om Rs te berekenen.
Punt-biseriële correlatie
, Beschrijft de samenhang tussen kwantitatieve en dichotome variabele.
Gebruik pearson correlatieformule om Rpb te berekenen.
Phi coëfficiënt
Beschrijft samenhang tussen twee dichotome variabelen
Gebruik Pearson correlatieformule om phi te berekenen
NB teken van correlatie hangt af van de wijze waarop 0 en 1 zijn toegewezen aan
groepen
R, Rs, Rpb en phi zeggen iets over samenhang in een steekproef
Alleen significantietoetsing is te beperkt ook effectmaat (correlatiecoëfficiënt)
Tweede hoorcollege – 8 feb 2021
Een regressie maakt het mogelijk om de ene variabele uit een of meerdere andere
variabelen te voorspellen.
- Een predictor (onafhankelijke) variabele X
- Een response/criterion (afhankelijke) variabele Y
1 predictorvariabele enkelvoudige lineaire regressie (simple)
2 predictorvariabele meervoudige lineaire regressie (multiple)
Error/residu (Ei) = geobserveerde waarde (Yi) - voorspelde waarde (^Yi)
Regressiemodel is gebaseerd op een steekproef met een bepaalde range van X-
scores
- Interpolatie; voorspelling maken binnen range van X en Y
- Extrapolatie; voorspelling maken buiten range van X en Y
Probleem; wanneer meeteenheid verandert, verandert ook regressievergelijking
Oplossing; gebruik gestandaardiseerde regressievergelijking
Variantie
Totaal = model + error
Totaal = verklaard + onverklaard
SSy = SSy(streepje) + SSe
SStotaal = SSmodel + SSerror
Beste fit van de data als de error minimaal is
In regressiemodel is variantie het ‘gemiddelde’ van de gekwadrateerde afwijkingen;
Mean Square (MS).
Hoe hoger de standaardfout van de voorspelling hoe meer de punten verspreid zijn
van de regressielijn.
Proportie verklaarde variantie (VAF) = dat deel van de variantie dat systematisch is.
College 1 – maandag 1 feb
Correlatie is geen causatie
Correlatie beschrijft het lineaire verband tussen twee (interval) variabelen.
1. Covariantie variabelen moeten samenhangen
2. Directionaliteit oorzaak gaat vooraf aan gevolg
3. Interne validiteit alternatieve verklaringen uitgesloten
Scatterplot;
- Richting positief vs negatief
- Sterkte hoe meer de punten op een rechte lijn liggen hoe sterker het
verband.
- Vorm lineair/niet lineair of homogeen/heterogeen
- Uitbijters punten die ver van de andere liggen
Covariantie (Sxy) = de mate waarin twee variabelen samen variëren
Formule in schrift
Covariantie geeft informatie over de sterkte en de richting van de samenhang
Nadeel moeilijk te interpreteren, want de waarde is afhankelijk van de
meeteenheid
Oplossing standaardiseren
Pearson r is een gestandaardiseerde maat die het lineaire verband beschrijft tussen
twee kwantitatieve variabelen en waarvan de waarde altijd tussen -1 en +1 ligt.
Voordeel makkelijker te interpreteren want de waarde is niet afhankelijk van de
meeteenheid
Scatterplot moet lineair zijn voor gebruik van pearson r
Oppassen voor;
- Niet-lineaire verbanden
- Uitbijters
- Heterogene subgroepen
- Restriction of range
Correlatiecoëfficiënten;
Kwantitatief + kwantitatief pearson r
Ordinaal + ordinaal spearman’s rho
Dichotoom + kwantitatief punt-biseriële correlatie
Dichotoom + dichotoom phi coëfficient
Spearman’s rho (Rs)
Beschrijft samenhang tussen twee ordinale/gerangordende variabelen
Wanneer scores nog geen rangscores zijn; zet scores om in rangnummers.
Dan; gebruik Pearson correlatieformule om Rs te berekenen.
Punt-biseriële correlatie
, Beschrijft de samenhang tussen kwantitatieve en dichotome variabele.
Gebruik pearson correlatieformule om Rpb te berekenen.
Phi coëfficiënt
Beschrijft samenhang tussen twee dichotome variabelen
Gebruik Pearson correlatieformule om phi te berekenen
NB teken van correlatie hangt af van de wijze waarop 0 en 1 zijn toegewezen aan
groepen
R, Rs, Rpb en phi zeggen iets over samenhang in een steekproef
Alleen significantietoetsing is te beperkt ook effectmaat (correlatiecoëfficiënt)
Tweede hoorcollege – 8 feb 2021
Een regressie maakt het mogelijk om de ene variabele uit een of meerdere andere
variabelen te voorspellen.
- Een predictor (onafhankelijke) variabele X
- Een response/criterion (afhankelijke) variabele Y
1 predictorvariabele enkelvoudige lineaire regressie (simple)
2 predictorvariabele meervoudige lineaire regressie (multiple)
Error/residu (Ei) = geobserveerde waarde (Yi) - voorspelde waarde (^Yi)
Regressiemodel is gebaseerd op een steekproef met een bepaalde range van X-
scores
- Interpolatie; voorspelling maken binnen range van X en Y
- Extrapolatie; voorspelling maken buiten range van X en Y
Probleem; wanneer meeteenheid verandert, verandert ook regressievergelijking
Oplossing; gebruik gestandaardiseerde regressievergelijking
Variantie
Totaal = model + error
Totaal = verklaard + onverklaard
SSy = SSy(streepje) + SSe
SStotaal = SSmodel + SSerror
Beste fit van de data als de error minimaal is
In regressiemodel is variantie het ‘gemiddelde’ van de gekwadrateerde afwijkingen;
Mean Square (MS).
Hoe hoger de standaardfout van de voorspelling hoe meer de punten verspreid zijn
van de regressielijn.
Proportie verklaarde variantie (VAF) = dat deel van de variantie dat systematisch is.