Periode 2.2A (2021)
Toetsing: data-analyseopdracht met statistische modellen (3 uur de tijd). iedere student werkt met
een uniek SPSS-databestand, uitwerkingen in een Word-document met plaatjes en tabellen, en
inleveren via Nestor
Overzicht cursus:
1. Regressieanalyse
2. Multivariate relaties
3. Variantieanalyse
4. Covariantieanalyse
5. Regressieanalyse met categorische predictoren
6. Logistische regressieanalyse
7. Repeated measures ANOVA
(3,4 en 7): Grof onderscheid tussen deze dingen is dat ze aan de ene kant
regressieproblemen hebben (te zien in week 1,2,5 en 6) dan heb je een afhankelijke/interval-
variabele die je wilt voorspellen obv een aantal andere variabelen. En in week 3,4 en 7 kijken
we naar de spreidingen rond gemiddeldes en willen we voornamelijk groepen vergelijken
(zien of er een gemiddeld verschil is tussen de groepen en of dit ook opgaat voor de
populatie). 4 is een variant van 3 en 7 is een uitbreiding van 3.
Inhoud
Welk model?...........................................................................................................................................2
College 1.................................................................................................................................................2
Regressieanalyse................................................................................................................................2
Kleinste kwadratensom residuen.......................................................................................................3
Pearson correlatie..............................................................................................................................4
Statistisch model voor regressieanalyse.............................................................................................5
Regressieanalyse in SPSS....................................................................................................................7
Verklaarde variantie...........................................................................................................................8
Assumpties regressieanalyse..............................................................................................................9
ANOVA-tabel................................................................................................................................15
Afwijkingen in data (bijv. uitbijters) + mogelijke oplossingen...........................................................17
College 2 – Multivariate analyses.........................................................................................................18
,College 3 – Variantieanalyse.................................................................................................................32
t-toets voor 2 onafhankelijke groepen.............................................................................................33
t-toets voor gepaarde waarnemingen..............................................................................................35
éénwegvariantieanalyse (/éénweg ANOVA).....................................................................................35
Tweewegvariantieanalyse (tweeweg anova)....................................................................................41
College 4 – covariantie-analyse............................................................................................................48
College 5: regressieanalyse met categorische predictoren..................................................................61
College 6 – logistische regressieanalyse...............................................................................................69
College 7: repeated measures ANOVA.................................................................................................81
Responsiecollege..................................................................................................................................91
Welk model?
Een van de leerdoelen van de cursus: verschillende modellen om verschillende onderzoeksvragen
mee te beantwoorden. Afhankelijk van het meetniveau (daar staan de afkortingen voor) en van het
aantal onafhankelijke variabelen (voorspellers, X1 en X2).
Onafh. Afh.
X1 X2 Y Model
DUM INT t-toets voor onafhankelijke groepen
NOM INT éénwegvariantieanalyse (ANOVA)
NOM NOM INT tweewegvariantieanalyse (ANOVA)
INT INT enkelvoudige regressieanalyse
INT INT INT multipele regressieanalyse
INT NOM INT covariantieanalyse
INT DUM DUM logistische regressieanalyse
College 1
Regressieanalyse
(komt op verschillende plaatsen terug)
Enkelvoudige regressieanalyse: 1 voorspeller
Multiple regressieanalyse: meerdere voorspellers
Lineaire relaties
- In veel onderzoekssituaties zijn er intervalvariabelen (INT)
, o Waarbij er heel veel verschillende waardes zijn en waarbij het verschil tussen
waardes die je bekijkt allemaal ongeveer hetzelfde zijn, die liggen vast
o VB:
▪ Lengte, gewicht, leeftijd
▪ Schaalscores voor introversie, depressie, coping, attitude
(meetinstrumenten)
▪ Vaardigheidsscores voor taal, rekenen
o Vanuit een wetenschappelijke theorie hebben we vaak verwachtingen over hoe
variabelen gerelateerd zijn. Hoe kan je een relatie uitdrukken?
Bij de populatie moet je duidelijk maken over welke groep je iets wilt zeggen.
Spreidingsdiagram:
Opvallend:
Hogere scores op coping, lagere score op BDI
🡪 richting
Hoe sterk is de relatie?
Veronderstel dat de relatie lineair is 🡪 toename in coping is
proportioneel t.o.v. afname BDI
- Een lineair model werkt goed in de praktijk: het blijkt
dat veel relaties tussen twee intervalvariabelen met een lineair verband zijn samen te vatten
(en is simpel)
- Een lijn wordt beschreven door een helling
o Dit getal (= parameter) geeft
• richting van relatie weer
• interpretatie aan relatie (negatief of positief verband bijv.)
- Verschillende lijnen mogelijk:
o Bijv. eentje die ook een maat voor sterkte relatie geeft
Kleinste kwadratensom residuen
, (Sums of squares)
Welke lijn moet je nu kiezen in zo’n puntenwolk? (alleen bij logistische regressieanalyse werkt dit net
iets anders, maar bij de meeste modellen die we gebruiken wel)
• Bereken alle residuen
(= afstanden punten tot lijn)
• Kwadrateer alle residuen
• Tel alle gekwadrateerde residuen op
• Lijn kiezen zodat deze som zo klein mogelijk is
Kleinste kwadratensom van residuen is uniek 🡪 unieke lijn
Vraag 1 en 2 zou je kunnen beantwoorden met de pearson correlatie of eventueel met enkelvoudige
regressie (bij de laatste is de vraagstelling vaak net wat anders – ‘voorspeld’).
Pearson correlatie
Maat voor sterkte lineaire relatie (dat zie je aan het kwadraat van deze correlatie)
- Onderzoeksvraag 1: Is er een relatie tussen BDI en coping in de populatie?
o Nulhypothese bij t-toets (dat is de p-waarde die je in het tabelletje van SPSS ziet)
o H0: r = 0 (geen relatie)
bij p < 0.001 🡪 significante relatie tussen BDI en coping (dat is de p-waarde die je in
het tabelletje ziet:)
- SPSS: