Introductie tot multivariate verbanden (en de cursus)
• Basis gelegd in statistiek I
- Steekproeven
- Beschrijvende statistiek
• Getallen (gemiddelde, standaarddeviaties), tabellen,
figuren etc. om data over personen te beschrijven
• Kan gaan over populatie of steekproef
- Inferentiële statistiek
• Op basis van steekproef uitspraken/voorspellingen
doen over populatie
- Statistiek 1 ging over 1 of 2 variabelen → maar de meeste vragen in de psychologie gaan
over complexere fenomenen
• Correlatie en causaliteit
- Correlatie ≠ causatie!
- Voorbeeld: chocoladeconsumptie en nobelprijs winnaars
• Positief verband: hoe meer chocolade, hoe meer nobelprijs winnaars
• Maar: in landen met welvaart over het algemeen meer chocolade consumptie →
door welvaart ook meer investering in wetenschap en dus meer nobelprijs winnaars
- Noemen we een spurieus verband (schijnverband):
• Er is een verband tussen A en B
• Maar, dit verband is te verklaren door andere variabelen die zowel A als B
veroorzaken → welvaart verklaart zowel mate van chocolade consumptie als het
aantal nobelprijs winnaars
• A veroorzaakt B niet (zitten andere variabelen achter)
• Criteria om causaliteit vast te stellen
- Veel vragen in ons vakgebied gaan over causaliteit:
• Wat is het effect van een interventie (x) op … (y)
• Is gamen/pesten (x) schadelijk voor … (y)
• Zorgen kleinere klassen (x) voor betere leerprestaties (y)
- We kunnen alleen beargumenteren dat B veroorzaakt wordt door A als:
1. Er een verband bestaat tussen A en B (associatie)
2. B moet plaatsvinden na A (volgordelijkheid)
3. Het verband tussen A en B niet wordt verklaard door andere factoren (alternatieve
verklaringen zijn uitgesloten)
,• Alternatieve verklaringen uitsluiten
- Kunnen we doen door te controleren voor andere variabelen → effect wegnemen
Twee manieren:
Experimentele controle
- In je onderzoeksdesign
- RCT (randomized control trial) vaak als gouden standaard gezien
• Volgordelijkheid gemanipuleerd (laat iets gebeuren en daarna kijk je wat effect is)
• Alternatieve verklaringen (deels) uitsluiten door randomisatie → willekeurig
personen aan controle en experimentele conditie toe te wijzen
- Zowel observeerbare als niet-observeerbare kenmerken moeten gelijk zijn (in beide
groepen)
- Dit is extreem ingewikkeld en niet realistisch/haalbaar → daarom andere manier
Statistische controle
- In je data-analyse strategie → In je analyses controleer je voor andere variabelen
- Optie 1: onderzoek x-y verband binnen subgroepen van je dataset (op basis van andere
variabelen) → vaak niet realistisch
• Kijk bijv. naar landen met vergelijkbare welvaart in relatie chocoladeconsumptie en
nobelprijs winnaars (dus setjes maken van vergelijkbare landen)
- Optie 2: neem alternatieve verklaringen op in je statistische model → deze cursus leren
• Multivariate relaties
- Bij die 2e optie, zijn twee dingen heel belangrijk:
1. Om relevante alternatieve verklaringen te herkennen
→ Ken je theorie
2. En je statistische analyses en interpretatie hierop aan te kunnen passen
Met als doel: vertekende resultaten door lurking/sluimerende variabelen vermijden
(= variabelen niet meegenomen in studie maar wel de relatie verklaren of
beïnvloeden)
→ Ken je statistiek
- Zijn allemaal soorten verbanden die je moet kunnen herkennen → gaan die doorlopen
vandaag
• Multivariate relaties: spurieus verband
- Spurieus verband (schijnverband) tussen x en y
= wanneer beide variabelen ook samenhangen
met een derde variabele en de relatie tussen x en
y verdwijnt (grotendeels) als gecontroleerd wordt
voor deze derde variabele
- Het geschatte verband tussen variabelen kan dus
drastisch veranderen, afhankelijk van de gekozen
data-analyse strategie (welke variabelen je
meeneemt)
, - Nog een voorbeeld:
Conclusie: wees bewust van lurkende
variabelen, zodat je ze kan meenemen in
analyses
• Multivariate relaties: suppressie
- Suppressie (onderdrukking)
= soms vind je (bijna) geen verband tussen x en y → totdat je controleert voor een derde
variabele
- Voorbeeld: interventie (praten over boeken) en
kijken naar woordenschat
• Sommige scholen wel interventie en sommige
niet: doen die interventiescholen het beter op
woordenschat? → Antwoord: Nee
• Maar: in de interventiescholen scoorden
kinderen op een pre-test lager dan de
controlescholen, dus de pre-test verklaart de
verschillen in woordenschat
• Is dus suppressie = het verband wordt
onderdrukt, totdat je controleert voor de
relevante 3e variabele
• Multivariate relaties: Simpson’s paradox
- Simpson’s paradox
= soms is het verband tussen x en y zelfs omgekeerd nadat we controleren voor een
derde variabele
- Voorbeeld: over algemeen een negatief verband tussen
typsnelheid en aantal typfouten
• Gemiddeld genomen: negatief verband – ervaren
typisten typen sneller en maken weinig typfouten
• Op individueel niveau: positief verband – hoe sneller je
typt, hoe meer typefouten je maakt
• Dus, type-ervaring verklaart iemands typesnelheid →
positief: hoe meer ervaring, hoe minder typfouten
En als je daarvoor controleert, kan het verband zomaar ineens
veranderen → dat sneller typen wel samenhangt met maken van
meer typfouten
- Dit komt vaak voor wanneer grote groepen data vertaald worden naar
subgroep niveau → dan zie je omgekeerde verbanden
, • Multivariate relaties: kettingrelatie
- Kettingrelatie (mediatie)
= een andere reden waardoor het verband tussen x1
en y soms verdwijnt na controle voor x2
- x1 heeft een indirect effect op y, via mediator x2
- In andere woorden:
• x1 veroorzaakt x2
• x2 veroorzaakt y
- Voorbeeld: mensen die langer naar school gaan
hebben een hogere levensverwachting
• Dus, variabele die hier tussenin kan zitten: die
verklaard wordt door onderwijs → en op zijn
beurt weer levensverwachting bepaalt = inkomen
• Noemen we mediatie
• Door inkomen een hoge SES → meer geld om
gezond eten te kopen etc. → verklaart levensverwachting
- A verklaart niet B → Maar A verklaart B en B
verklaart C
- Waardoor soms, als je die derde variabele
meeneemt (bijv. inkomen), dat hele verband
verdwijnt of zwakker wordt
- Vaak een onderwerp in interventie-studies
- Belangrijk om de ‘mechanismen van verandering’ van je interventie identificeren
- Bij al deze voorbeelden: twee variabelen met een bepaalde relatie → en die relatie
verdwijnt/verandert/komt tevoorschijn als je een derde variabele toevoegt
- Omdat die derde variabele een effect heeft op zowel x als y (controle variabele)
• Multivariate relaties: statistische interactie
- Interactie-effect tussen voorspellers
= de relatie tussen x1 en y is verschillend voor
verschillende van x2 (de moderator)
- Hebben dus een moderator → die heeft geen
effect of x1 of op y, maar op de relatie tussen
x1 en y (belangrijk verschil!)
- Het verband tussen twee variabelen hangt af
van het niveau van de moderator
- Betekent dat bijv. dat het verband tussen x1
en y voor een bepaald niveau (bijv.
controlegroep), terwijl het voor een andere
groep op die moderator negatief is