Statistische geletterdheid = vaardigheid in het begrijpen en kritisch evalueren van statistische
resultaten die voorkomen in het dagelijks leven.
Een belangrijk punt hierbij is dat een correlatie niet gelijk staat aan causatie, maar veel vragen binnen
het vakgebied van psychologie hebben wel betrekking op causaliteit. Er zijn drie voorwaarden voor
causaliteit:
1. Er is een verband tussen A en B (associatie).
2. B moet plaatsvinden na A (volgordelijkheid).
3. Het verband tussen A en B wordt niet verklaard door andere factoren (alternatieve
verklaringen zijn uitgesloten) -> dit is vooral de focus van statistiek 2, maar is ook de meest
complexe criteria om aan te voldoen.
Er zijn twee manieren waarop we alternatieve verklaringen kunnen uitsluiten:
- Experimentele controle opzetten van een onderzoeksdesign, waarbij een interventiegroep
wordt vergeleken met een controle groep. Gerandomiseerde en een gecontroleerde
steekproef is hierbij de gouden standaard. Een experimentele controle manipuleert de
volgordelijkheid en sluit alternatieve verklaringen uit door randomisatie. Tevens, is een
experimentele setup niet altijd haalbaar of realistisch;
- Statistische controle strategie binnen de data-analyse. Hierbij zijn er twee opties:
o Optie 1 onderzoek x-y verband binnen subgroepen. Dit is overigens vaak niet
realistisch, aangezien er veel data nodig is.
o Optie 2 neem alternatieve verklaringen op in je statistische model -> dit is wat we
binnen deze cursus gaan bekijken.
Voor multivariate relaties (relaties met 3 of meer variabelen) is het belangrijk om relevante
alternatieve verklaringen te herkennen (hiervoor heb je theorie nodig) en om de correcte statistische
analyses uit te voeren en deze correct te interpreteren (statistiek kennis is nodig). Door de theorie en
statistische kennis te weten kan je vertekende resultaten door lurking (sluimerende) variabelen
vermijden (= variabelen die niet zijn meegenomen in een studie, maar wel de onderzochte relatie
verklaren of beïnvloeden).
Hierbij is het ook belangrijk om bewust te zijn van de verschillende multivariate relaties die bestaan:
- Spurieus verband (schijnverband) beide variabelen hangen samen met een derde variabele,
waardoor de relatie tussen x en y verdwijnt (grotendeels) als gecontroleerd wordt voor deze
derde variabele.
- Suppressie soms vind je (bijna) geen verband tussen x en y, totdat je controleert voor een
derde variabele. Het verband wordt hierbij onderdrukt door de derde variabele.
,- Simpson’s paradox soms is het verband tussen x en y omgekeerd nadat we controleren voor
een derde variabele (bijv. het verband veranderd van negatief naar positief).
- Kettingrelatie verband waarbij x1 een indirect effect op y, via mediator x2. Oftewel: x1
veroorzaakt x2, x2 veroorzaakt y. Dit lijkt op een spurieus verband, aangezien er afhankelijk
geen verband aanwezig lijkt te zijn, maar bij introducering van een derde variabele wel, maar
dit is net iets anders. Bij een spurieus verband heeft de derde variabele zowel met x1 als y
een verband, terwijl bij een kettingrelatie de derde variabele een ‘tussen’ variabele is die het
verband tussen x1 en y verklaart.
- Interactie-effect de relatie tussen x1 en y is verschillende voor verschillende niveaus van x2
(de moderator). Dit kan verschillende vormen aannemen:
o Geen relatie tussen x en y maar bijv. wel binnen subpopulaties op basis van x2. Dit
kan komen doordat positief/negatieve effecten elkaar opheffen in subpopulaties.
o Positieve relatie tussen x en y maar bijv. minder sterk of zelfs negatief/niet-bestaand
binnen subpopulaties op basis van x2.
o Negatieve relatie tussen x en y maar bijv. minder sterk of zelfs positief/niet-bestaand
binnen sommige subpopulaties van x2.
- Meerdere oorzaken verschillende variabelen verklaren tezamen verschillen in y. Deze
oorzaken kunnen (on)gecorreleerd zijn:
o (meestal) gecorreleerd we noemen dit ook wel confounding (= fenomeen waarbij
een derde, niet onderzochte variabele (ook wel een confounder genoemd) de relatie
tussen een oorzaak en een gevolg vertekent). Het verband tussen x en y veranderd
, (deels) wanneer een extra x wordt opgenomen in het model, bijv. in spurieuze
verbanden, suppressie en simpson’s paradox.
o Soms ongecorreleerd het verband tussen x en y verandert niet (of nauwelijks)
wanneer een extra x wordt opgenomen in het model. Hierbij kan er mogelijk sprake
zijn van interactie.
Het is vaak nuttig om extra variabelen op te nemen in een statistisch model, zodat de relatie tussen je
primaire voorspeller en uitkomstmaat betekenisvol geïnterpreteerd kan worden. Hierbij kan je
rekening houden met confounding (spurieuze verbande, suppressie en simpson’s paradox), interactie-
effecten, meerdere oorzaken en kettingrelaties.
Hoorcollege 2
Er zijn vijf belangrijke stappen in het toetsen van hypotheses:
1. Formuleer een hypothese wat zijn de verwachtingen?
2. Onderzoek kenmerken en variabelen inspecteren steekproefprocedure, (experimenteel)
design, meetniveaus.
3. Beschrijvende analyses wat zijn de steekproefkenmerken, hoe zijn de relevante variabelen
verdeeld (inclusief M en SD)? Hoe ziet mijn data eruit? Zijn er abnormale waardes
(uitschieters)? -> hierbij kan het helpen om de data te visualiseren, bijv. door
spreidingsdiagrammen. Hierbij kan je inspecteren of je een lineair model kan toepassen.
Hierbij stel je de vraag: heeft het zin om een rechte lijn door deze datapunten te trekken? Is
dit het geval? Dan gebruiken we de kleinste kwadratenmethode om het lineaire model te
schatten (= dit is de best passende rechte lijn die het dichtstbij alle datapunt ligt).
4. Inferentiële analyses test een verband of verschillen, inclusief een controle van de
modeldiagnostiek.
5. Resultaten interpreteren en rapporteren rapporteer je bevindingen in APA-stijl.
Voorbeeld klasomvang en schoolprestaties binnen dit voorbeeld zijn we benieuwd naar het verband
tussen klasomvang en schoolprestaties.
1. Hypothese hangt klasomvang samen met school prestaties? Dit is een ongerichte hypothese
(hypothese zonder richting, kan toegepast worden bij tegenstrijdige theorieën). Tevens,
gebruiken we in de praktijk vaak hypotheses met een richting.
2. Onderzoek kenmerken het is een cross-sectionele studie met klasomvang (primaire
voorspeller, kwantitatief) en schoolprestaties (gemiddelde score van een school op een
gestandaardiseerde test, is de uitkomstmaat en is kwantitatief) als uitkomstmaten.
3. Beschrijvende statistieken voor klasomvang geldt een gemiddelde van 21 (SD = 3.27) en voor
schoolprestaties een gemiddelde van 7.5 (SD = 0.67). Op basis van de data wordt de volgende
regressie formule opgesteld: 𝐴𝑃̂ = 6.072 + 0.068 ∗ 𝐶𝑆. In dit geval is onze b positief, wat