Analyse waarbij één uitkomstvariabele wordt voorspeld door meedere voorspellers
5.Toetsen
T-toets
test individuele predictors
1.Welke 2. Modeltype 3.Relaties / verklaringen H0: β = 0
analyse? df1 = aantal predictors
Meervoudige regressie: Lurking variabele df2 = N -k - 1
y = a + b1x1 + b2x2 Een variabele die niet in het significantie: p <.05
Interactie-effect: model zit maar wel invloed heeft
y = a + b1x1 + b2x2 + b3x1*x2 op de relatie tussen x en Y 4. Modeldiagnostiek F -toets
Y= Kwantitatief Y= Dichotoom test het hele model
Dummyvariabelen Spurieus verband
Lineariteit
Categorische variabel → 0/1 Een verband tussen X en Y
Predictor 1: Predictor 1:
verbandt tussen X en Y is lineair H0: b1 = b2 = ... = bk = 0
referentiecategorie: b = verschil verdwijnt wanneer je controleert de punten liggen ong rond een rechte
Kwantitatief Kwantitatief voor een 3de variabele F = MSB / MSW
met referentiegroep lijn
Predictor 2: Predictor 2: zie scatterplot: ‘residuals vs predicted’ F(df_between, df_within)
Kwantiatief Kwantiatief Lineaire regressie Confounding Homoscedasticiteit
formule: y^=a+bx Effectmaten voor
Een extra variabele vertekent het residuen hebben gelijke variantie
Predictor 1: Predictor 1: Residu = y-y^ grootte van het effect
verband tussen X en Y de punten zijn willekeurig verspreid
Kwantitatief Kwantitatief geen: trechtervorm R² voor regressie:
Predictor 2: Predictor 2: Variantie zie scatterplot: ‘residuals vs .02 = klein effect,
Supressie
Categorisch Categorisch TSS = totale variate Y predicted’ .13 = middel effect
Geen verband, totdat je
SSR = variatie in Y die wordt
Levene’s test voor homogeniteit: .26 = groot effect)
controleert voor een 3de p > .05 = varianties gelijk
verklaard door het model variabele. Onderdrukking van een p< .05 = variantie ongelijk
Multiple η² voor ANOVA
Multiple lineaire SSE = Variatie in Y die niet wordt achterliggende variabele
logistische verklaard door het model Normaliteit van residuen .01 = klein
regressie
regressie Simpson’s paradox de residuen moeten normaal verdeeld .06 = middel
/ ANCOVA zijn .14 = groot
Effectmaat Het verband tussen X en Y verandert histogram = klokvorm
R-Kwadraat = de proportie variatie van richting nadat je controleert voor of Q-Q plot: punten liggen op een
in Y die door het model wordt OR voor logistische regressie
een 3de variabele rechte lijn
Predictor 1: Predictor 1: verklaard OR = 1 = geen effect
Categorisch Categorisch Onafhankelijkheid OR > 1 = grotere kans
Predictor 2: Predictor 2: Kettingrelatie / Mediatie de observaties mogen niet van elkaar
ANOVA OR < 1 = kleinere kans
Categorisch Categorisch X beïnvloedt Y via een mediator afhankelijk zijn
Statistische methode om verschillen
(tussenvariabele) goed: verschillende studenten
tussen groepsgemiddelden te testen fout: dezelfde studenten
meerdere keren meten Post-hoc toetsen (na significantie ANOVA)
factoriële ANOVA Multiple logistische Interactie vergelijkingen tussen groepen
ANCOVA
regressie Combinatie van ANOVA en regressie Het effect van X op Y hangt van de waarde verhoogde kans op type 1 fout dus correctie:
> met Doel: Groepsverschillen testen terwijl je van een andere variabele Bonferronnie → conservatief
dummyvariabelen controleert voor een covariaat Tukey → minder conservatief