Field: Discovering Statistics Using IBM SPSS Statistics
Weken 1–8 | Hoofdstukken 2, 3, 6, 8, 9, 11, 12, 13, 14, 15, 16, 17
Conceptueel begrip · Samenhang · Beslislogica · SPSS-interpretatie
, Week 1 — Hoofdstuk 2: De SPINE van Statistiek
De SPINE is Fields metafoor voor de vijf pijlers waarop alle statistiek rust: Standaardisatie,
Parameters, Interval estimates, Null hypothesis testing en Error. Begrijp je deze vijf, dan begrijp je
de logica achter iedere toets die je later tegenkomt.
A Kernconcepten & Theorie
Populatie vs. Steekproef
Statistiek draait om één fundamenteel probleem: we willen uitspraken doen over een populatie
(alle mensen, alle metingen), maar we hebben alleen toegang tot een steekproef. De parameter is
de ware waarde in de populatie (onbekend); de statistiek is de schatting op basis van de
steekproef.
Centrale tendentie & Spreiding
Het gemiddelde (mean) is het rekenkundig middelpunt van een verdeling. Het is gevoelig voor
uitschieters. De mediaan is de middelste waarde en is robuuster. De modus is de meest
voorkomende waarde.
De standaarddeviatie (SD) beschrijft hoeveel scores gemiddeld afwijken van het gemiddelde. De
variantie is de SD in het kwadraat. Een grote SD betekent veel spreiding — de scores liggen ver
uit elkaar.
Bij een symmetrische, normaalverdeling geldt: gemiddelde ≈ mediaan ≈ modus. Bij een
rechtsschiefe verdeling (positief scheef) trekt een staart rechts het gemiddelde omhoog: modus <
mediaan < gemiddelde. Bij een linksschiefe verdeling geldt het omgekeerde.
De normaalverdeling
De normaalverdeling is de klokvormige, symmetrische verdeling die centraal staat in de klassieke
statistiek. Ze is volledig bepaald door het gemiddelde (μ) en de standaarddeviatie (σ). Ongeveer
68% van de scores valt binnen 1 SD van het gemiddelde, 95% binnen 2 SD, en 99.7% binnen 3
SD.
Veel toetsen gaan ervan uit dat data (of residuen) normaal zijn verdeeld. Waarom? Omdat de
theoretische verdelingen waarop toetsen zijn gebaseerd (t, F, χ²) voortvloeien uit de
normaalverdeling.
Standaardfout (Standard Error of the Mean — SEM)
Stel je trekt oneindig veel steekproeven van N personen uit dezelfde populatie en berekent steeds
het gemiddelde. De verdeling van al die steekproefgemiddelden heet de sampling distribution of
the mean. De standaardafwijking van die verdeling is de standaardfout (SEM = SD / √N).
De SEM vertelt hoe nauwkeurig jouw steekproefgemiddelde de populatiewaarde schat. Hoe groter
N, hoe kleiner de SEM, hoe preciezer je schatting.
Betrouwbaarheidsintervallen (Confidence Intervals — CI)
Een 95%-betrouwbaarheidsinterval zegt: als we dit onderzoek oneindig herhalen, dan bevat 95%
van de berekende intervallen de ware populatieparameter. Het is een uitspraak over de procedure,
niet over dit specifieke interval.
Veelgemaakte fout: 'Er is 95% kans dat de ware waarde in dit interval ligt.' Dat is de Bayesiaanse
interpretatie — in klassieke statistiek is de ware waarde vast (alleen onbekend) en het interval is
wat varieert.
Een smal interval = meer precisie (grote N of kleine SD). Een breed interval = meer onzekerheid.
Nulhypothesetoetsing (Null Hypothesis Significance Testing — NHST)
We formuleren een nulhypothese (H0): er is geen effect, geen verschil, geen relatie. De
alternatieve hypothese (H1) stelt dat er wél een effect is.
, We berekenen een toetsstatistiek (t, F, χ²) en bepalen de bijbehorende p-waarde: de kans op de
gevonden uitkomst (of een extremere) als H0 waar is. Als p < α (doorgaans .05) verwerpen we H0.
Tweezijdig toetsen (p < .05 aan beide kanten) vs. eenzijdig toetsen (p < .05 aan één kant).
Eenzijdig is krachtiger maar vereist een a priori verwachting van de richting.
Type I en Type II fouten
Fout Beschrijving
Type I fout (α) H0 verwerpen terwijl H0 waar is — een vals positief. Kans = α (doorgaans
.05).
Type II fout (β) H0 niet verwerpen terwijl H0 onwaar is — een vals negatief. Kans = β.
Power (1−β) Kans dat je een echt effect detecteert. Standaard streefwaarde: .80
(80%).
Effectgrootte
Statistische significantie zegt niets over de praktische relevantie. Een effect kan statistisch
significant zijn maar verwaarloosbaar klein (bij grote N). Effectgrootte meet hoe groot het effect is,
onafhankelijk van N.
Maat Gebruik & richtlijnen
Cohen's d Verschil tussen twee gemiddelden in SD-eenheden. Klein: .20, Middelgroot:
.50, Groot: .80
r (Pearson) Correlatie. Klein: .10, Middelgroot: .30, Groot: .50
R² Proportie verklaarde variantie in regressie. Klein: .02, Middelgroot: .13,
Groot: .26
η² (eta²) Proportie verklaarde variantie in ANOVA. Klein: .01, Middelgroot: .06, Groot:
.14
B Samenhang & Rode Draad
De SPINE is de fundering van alles. Elke toets die je later ziet — t-toets, ANOVA, regressie,
MANOVA — is een invulling van dezelfde logica: schat een effect in je steekproef, kwantificeer de
onzekerheid via de SEM, toets of het effect significant is, rapporteer de effectgrootte.
De SEM is de brug tussen steekproef en populatie. Alle toetsstatistieken (t, F, z) zijn in essentie
het effect gedeeld door de SEM — hoe groter het effect ten opzichte van de meetfout, hoe groter
de toetsstatistiek, hoe kleiner de p-waarde.
C Wanneer kies je wat — Beslislogica
Stel: je wilt weten of een effect echt is (niet toevalsruis) → gebruik NHST + rapporteer p.
Je wilt weten hoe groot het effect is in de praktijk → gebruik effectgrootte. Je wilt weten
hoe nauwkeurig je schatting is → gebruik een CI.
D Assumpties & Voorwaarden — Conceptueel
• Normaliteit: De steekproefverdeling van het gemiddelde is bij grote N normaal verdeeld
(centrale limietstelling), zelfs als de ruwe data dat niet zijn. Bij kleine N is normaliteit van de
data zelf belangrijker.
• Onafhankelijkheid van observaties: Iedere meting moet onafhankelijk zijn van de andere.
Geschonden bij herhaalde metingen of gepaarde data — dan zijn speciale toetsen nodig.