Multipele Regressie: meerdere voorspellers waarmee je de uitkomst kunt verklaren. 1 afhankelijk,
meer dan 1 predictor/onafhankelijk). Predictoren.
- 1 afhankelijke variabele (Y)
- 1 of meerdere onafhankelijke variabelen (minimaal interval). Nominaal/ordinaal wordt
omgezet in dummyvariabelen.
- 1 of meerdere onafhankelijke variabelen (dichotoom (= nominaal met 2 categorieën))
Kunnen we iemands waarde op een kenmerk voorspellen met kennis over andere kenmerken?
Als je voorspelling doet wordt het ^Y
Kleinste kwadraten criterium: best passende rechte lijn; lijn waarbij voorspellingsfout zo klein
mogelijk is (afstand tot de regressielijn).
Goodness-of-fit (R2): vergelijking (ratio) van lineair model (regressielijn) met basismodel (basislijn).
Beste model = het model (regressielijn) met kleinste residuele kwadratensom. 100% variantie
verklaren: R2 = 1.
F-ratio bij multipele regressieanalyse: toetsingsgrootheid voor verklaarde variantie in Y door lineair
regressiemodel (R2). Als rechte lijn een betere weergave is van geobserveerde gegevens dan het
algemeen gemiddelde (basismodel).
Effectgrootte: R2 = verklaarde variantie door lineair model. Tussen 0 (verklaart niks) en 1 (verklaart
alles).
ANOVA als regressiemodel: veranderen naar dummy’s
ANCOVA uitvoeren binnen multipele regressie: groepsvariabele representeren door dummy’s
ANOVA: bij groepen met meer dan 2 klassen. 1 afhankelijk (Y), 1 onafhankelijk (X met meer dan 2
klassen). Spreiding verklaren door bij welke groep mensen horen? Gemiddeldenmodel (beschrijven
van verschillen tussen en binnen groepen). Factoren.
Kunnen we spreiding in scores verklaren door bij welke groep mensen horen?
- Afhankelijk (Y): minimaal interal
- Onafhankelijk (X): minimaal nominaal met a categorieën
F-ratio bij (meerweg-)ANOVA: toetsingsgrootheid voor verklaarde variantie in Y door
gemiddeldenmodel (η2). Als groepsgemiddelden significant verschillen, dan zijn groepsgemiddelden
een betere weergave van geobserveerde gegevens dan het algemeen gemiddelde (basismodel).
Formule op formuleblad.
Effectgrootte: η2 = verklaarde variantie door gemiddeldenmodel. Tussen 0 (verklaart niks) en 1
(verklaart alles). Kijken in kolom ‘partial eta squared’. Hoeveel kun je met je model verklaren?
ANOVA als regressiemodel: veranderen naar dummy’s.
, Tweeweg/meerweg ANOVA: 1 afhankelijk (Y), meer dan 1 onafhankelijk (X met meer dan 2 klassen).
Factoren. Meerdere categorische variabelen. Ook interactie-effect mogelijk. Gemiddeldenmodel.
Verschillen twee of meer groepen op het gemiddelde van een variabele Y? (bv verschillen
experimentele en controlegroep van elkaar? Door interventie zou er een verschil moeten ontstaan)
- Afhankelijke variabele (Y): minimaal interval
- Onafhankelijke variabelen (X): minimaal nominaal met a categorieën (groepsvariabelen)
3x2 factorieel ontwerp: stel je hebt 3 verschillende leeftijden en 2 verschillende geslachten, is het 3x2.
2 variabelen: ene heeft 3 categorieën erin zitten, de andere 2.
F-ratio bij (meerweg-)ANOVA: toetsingsgrootheid voor verklaarde variantie in Y door
gemiddeldenmodel (η2). Als groepsgemiddelden significant verschillen, dan zijn groepsgemiddelden
een betere weergave van geobserveerde gegevens dan het algemeen gemiddelde (basismodel).
Formule op formuleblad.
Degrees of freedom: zijn nodig om te weten hoe de F-waarden verdelingen eruit komen te zien.
Effectgrootte: η2 = verklaarde variantie door gemiddeldenmodel. Tussen 0 (verklaart niks) en 1
(verklaart alles). Kijken in kolom ‘partial eta squared’. Hoeveel kun je met je model verklaren?
Dummyvariabelen: uitsplitsing die zegt of het wel of niet bij deze categorie hoort. Representeren
nominale of ordinale variabelen met 2 of meer categorieën. Waarden 0 en 1. Door representatie van
categorische variabelen met dummy’s is een lineaire regressieanalyse mogelijk.
- X met k categorieën → k-1 dummyvariabelen
X = leeftijd met 3 categorieën, D2 = dummy jongste groep, D3 = dummy middelste groep
(oudste groep = referentiegroep).
- Aan- en uitzetten (1 = aan, 0 = uit).
ANOVA als regressiemodel: veranderen naar dummy’s.
Regressievergelijking voor tweeweg ANOVA (2x3)
ANCOVA: situatie waarin we 1 of meerdere groepsvariabelen onderscheiden naast een
intervalvariabele moet geanalyseerd worden met een ANCOVA.
Verschillen twee of meer groepen in gecorrigeerde middelen (adjusted means) van een kenmerk?
Covariaat: intervalvariabele die je toevoegt om voor te corrigeren. Om een betere/eerlijkere
vergelijking te krijgen van de groepen die onderscheiden worden bij de categorische variabelen.
ANCOVA-model
- Afhankelijke variabele (Y)
- Onafhankelijke variabele(n) (X), minimaal nominaal
- Covariaat: variabele(n), minimaal interval
Kan ook binnen multipele regressie, maar dan moet groepsvariabele veranderen in dummyvariabele.