HOORCOLLEGE 1
Stel: je wilt weten of een nieuwe lesmethode beter werkt dan de oude. Of
mannen en vrouwen verschillen in zelfvertrouwen. Of therapie helpt tegen
angst. Je kunt onmogelijk álle mensen van de wereld onderzoeken. Dat
kost te veel tijd, geld en moeite. Dus doen onderzoekers iets slimmer: Ze
pakken een kleine groep mensen → een steekproef. En met die steekproef
proberen ze iets te zeggen over de hele groep mensen → de populatie. Dat
is eigenlijk waar statistiek over gaat: van een klein groepje iets leren over
een grote groep.
Twee soorten statistiek
Er zijn twee belangrijke onderdelen.
1. Beschrijvende statistiek
Dit betekent: data samenvatten. Want ruwe data is vaak één grote chaos.
Bijvoorbeeld: 1 4 3 2 4 4 1 3 2 4 ... Daar kun je weinig van begrijpen. Dus
statistiek helpt om daar overzicht van te maken. Dat kan op twee
manieren: scores groeperen of belangrijke kenmerken berekenen.
Frequentieverdeling: hoeveel keer komt iets voor?
Stel dat mensen een score geven van 1 t/m 4. Dan kun je tellen: hoe vaak
komt 1 voor? hoe vaak komt 2 voor? hoe vaak komt 3 voor? hoe vaak
komt 4 voor? Dat heet een frequentieverdeling. Een histogram is daar een
plaatje van. Daardoor zie je meteen: welke scores vaak voorkomen en
welke bijna niet voorkomen. Dus: een enorme lijst met getallen verandert
in een duidelijk overzicht.
Centrale tendentie: wat is de “typische” score?
Nu wil je weten: “Wat is ongeveer de normale score?” Dat noemen we de
centrale tendentie. Daarvoor zijn drie bekende maten: gemiddelde,
mediaan & modus. De belangrijkste is meestal het gemiddelde. Het
gemiddelde bereken je door: alle scores op te tellen en te delen door het
aantal scores. Bijvoorbeeld: 2 + 4 + 4 = 10. = 3,33. Dus gemiddeld
is de score 3,33.
Spreiding: hoe verschillend zijn mensen?
Alleen een gemiddelde zegt niet alles. Kijk maar: Groep A: 5 5 5 5 5; Groep
B: 1 3 5 7 9. Gemiddelde is bij beide groepen 5. Maar groep B verschilt
veel meer van elkaar. Dat noemen we spreiding. Belangrijke maten
hiervoor zijn: range, variantie & standaarddeviatie.
Variantie en standaarddeviatie
,Dit vinden veel studenten lastig, maar het idee is eigenlijk simpel. Je kijkt:
“Hoe ver zitten scores gemiddeld van het gemiddelde af?”. Als iedereen
dicht bij het gemiddelde zit:
→ kleine spreiding. Als scores heel verschillend zijn: → grote spreiding. De
standaarddeviatie is gewoon een handige maat daarvoor. Dus onthoud
simpel: kleine SD = mensen lijken op elkaar en grote SD = mensen
verschillen veel.
Waarom hebben we inferentiële statistiek nodig?
Beschrijvende statistiek beschrijft alleen je steekproef. Maar onderzoekers
willen méér. Ze willen iets zeggen over de hele populatie. Daarvoor
gebruik je: inferentiële statistiek. Dat betekent eigenlijk: “Van steekproef →
conclusie over populatie.”
Hypothese toetsen: het hart van statistiek
Nu komt het belangrijkste onderdeel van het vak. Stel: je denkt dat het
gemiddelde van een populatie 2,5 is. Maar je steekproefgemiddelde is 2,9.
Dan vraag je je af: “Is dit verschil gewoon toeval? Of is er écht iets aan de
hand?” Daarvoor gebruik je een hypothesetoets.
H0 en H1
Je maakt altijd twee hypotheses. H0 = nulhypothese Dit betekent meestal:
“er is geen verschil” of “er gebeurt niets bijzonders”. Bijvoorbeeld: H0: μ =
2.5. Dus:
het populatiegemiddelde is 2,5. H1 = alternatieve hypothese. Dit is wat de
onderzoeker eigenlijk verwacht. Bijvoorbeeld: H1: μ ≠ 2.5 Dus: het
gemiddelde is NIET 2,5.
Belangrijke regel
Bijna altijd geldt: H0 bevat een = en H1 bevat de verwachting.
De vier stappen van toetsen
Stap 1: hypotheses maken
Bijvoorbeeld: H0: μ = 2.5 en H1: μ ≠ 2.5
Stap 2: kies α (alpha)
Meestal: α = 0.05. Dat betekent: “We accepteren maximaal 5% kans op
een verkeerde conclusie.”
Stap 3: bereken de p-waarde
Dat doet SPSS meestal voor je. De p-waarde vertelt: “Hoe waarschijnlijk is
mijn resultaat als H0 waar is?”
,Stap 4: conclusie
Nu vergelijk je: p met α. Regel: p ≤ 0.05 → H0 verwerpen & p > 0.05 → H0
niet verwerpen.
Wat betekent een p-waarde nou écht?
Dit is superbelangrijk. Veel studenten leren het trucje, maar begrijpen het
niet. Dus simpel: De p-waarde zegt: “Hoe vreemd is mijn resultaat als H0
klopt?”. Kleine p-waarde: → resultaat is erg vreemd onder H0 → dus H0
vertrouwen we niet meer. Grote p-waarde: → resultaat is best normaal
onder H0 → dus H0 houden we voorlopig aan.
Eénzijdig en tweezijdig toetsen
Tweezijdig
Je kijkt: “Is het anders?”. Dus: groter OF kleiner. Bijvoorbeeld: H1: μ ≠ 2.5.
Eénzijdig
Je kijkt maar één kant op. Bijvoorbeeld: H1: μ > 2.5 of H1: μ < 2.5. SPSS
geeft standaard tweezijdige p-waardes. Dus bij eenzijdige toetsen moet je
soms aanpassen.
Betrouwbaarheidsinterval (BI)
Dit vinden docenten heel belangrijk. Een betrouwbaarheidsinterval zegt:
“Waar denken we dat de echte populatiewaarde ligt?” Bijvoorbeeld: 95%-
BI = [2.1 ; 3.4]. Dan denk je: “Met 95% vertrouwen ligt het echte
gemiddelde ergens tussen 2.1 en 3.4.”. Niet: “95% kans dat μ daarin zit.”.
Dat zeggen studenten vaak fout.
Relatie tussen BI en hypothesetoets
Dit is een favoriete tentamenvraag. Regel: ligt de H0-waarde BINNEN het
BI?
→ H0 niet verwerpen & ligt de H0-waarde BUITEN het BI? → H0 wel
verwerpen. Dus BI en hypothesetoets vertellen eigenlijk hetzelfde verhaal.
t-toetsen
In deze cursus zijn t-toetsen heel belangrijk. Een t-toets kijkt of
gemiddelden verschillen. Bijvoorbeeld: verschillen mannen en vrouwen?
Werkt therapie beter dan geen therapie?
Independent samples t-test
Dit gebruik je bij: twee verschillende groepen. Bijvoorbeeld: mannen
versus vrouwen. De vraag is dan: “Zijn de gemiddelden verschillend?”.
Levene’s test
, Deze test kijkt of spreidingen gelijk zijn. SPSS geeft: “equal variances
assumed” en “equal variances not assumed”. Je moet eerst naar Levene’s
test kijken om te weten welke rij je gebruikt.
HOORCOLLEGE 2
In het vorige college heb je geleerd hoe onderzoekers kijken of groepen
van elkaar verschillen. Bijvoorbeeld: Zijn mannen en vrouwen
verschillend? Werkt een therapie? Helpt een medicijn? Daar gebruikten we
toetsen voor, zoals de t-toets. Maar nu komt de volgende stap. Want
onderzoekers willen niet alleen weten: “Is er een verschil?” Ze willen ook
weten: Hoe groot is dat verschil eigenlijk? Hoe zeker kunnen we dat
verschil vinden? Wat als we meer dan twee groepen vergelijken? En
precies daar gaat dit college over.
Power — hoe goed is een toets in het vinden van een echt effect?
Stel: Er zijn echt minder politieagenten op straat. Daardoor wordt het
minder veilig. Dus in werkelijkheid bestaat er écht een effect. Maar soms
vindt een onderzoek dat effect niet. Waarom? Omdat statistiek nooit
perfect is. Onderzoekers kunnen twee soorten fouten maken.
Twee belangrijke fouten
Type I fout. Dit betekent: Je denkt dat er een effect is… maar eigenlijk
bestaat het effect helemaal niet. Dus: je verwerpt H0 terwijl H0 eigenlijk
waar is. Dit is een “vals alarm”. Bijvoorbeeld: je denkt dat een medicijn
werkt, maar eigenlijk werkt het niet. De kans hierop noemen we: α (alpha).
Vaak: α = 0.05. Dus: 5% kans op een vals alarm.
Type II fout. Nu het omgekeerde. Er bestaat WEL een effect… maar jij vindt
het niet. Dus: H1 is eigenlijk waar, maar jij houdt H0 aan. Bijvoorbeeld: een
therapie helpt echt, maar jouw onderzoek ziet dat niet. De kans hierop
heet: β (beta).
Power
En nu komt het belangrijkste idee. Power = kans dat je een écht effect
ontdekt. Dus: “Als H1 waar is, hoe groot is dan de kans dat mijn toets dat
ook vindt?”. Power = 1 – β. Hoge power = goed. Waarom? Omdat je dan
een grote kans hebt om echte effecten te vinden.
Wat beïnvloedt power?
Er zijn vier belangrijke dingen.
1. Steekproefgrootte (N)
Heel belangrijk. Meer mensen in je onderzoek → hogere power. Waarom?
Omdat je gemiddelden stabieler worden. Met weinig mensen is alles
Stel: je wilt weten of een nieuwe lesmethode beter werkt dan de oude. Of
mannen en vrouwen verschillen in zelfvertrouwen. Of therapie helpt tegen
angst. Je kunt onmogelijk álle mensen van de wereld onderzoeken. Dat
kost te veel tijd, geld en moeite. Dus doen onderzoekers iets slimmer: Ze
pakken een kleine groep mensen → een steekproef. En met die steekproef
proberen ze iets te zeggen over de hele groep mensen → de populatie. Dat
is eigenlijk waar statistiek over gaat: van een klein groepje iets leren over
een grote groep.
Twee soorten statistiek
Er zijn twee belangrijke onderdelen.
1. Beschrijvende statistiek
Dit betekent: data samenvatten. Want ruwe data is vaak één grote chaos.
Bijvoorbeeld: 1 4 3 2 4 4 1 3 2 4 ... Daar kun je weinig van begrijpen. Dus
statistiek helpt om daar overzicht van te maken. Dat kan op twee
manieren: scores groeperen of belangrijke kenmerken berekenen.
Frequentieverdeling: hoeveel keer komt iets voor?
Stel dat mensen een score geven van 1 t/m 4. Dan kun je tellen: hoe vaak
komt 1 voor? hoe vaak komt 2 voor? hoe vaak komt 3 voor? hoe vaak
komt 4 voor? Dat heet een frequentieverdeling. Een histogram is daar een
plaatje van. Daardoor zie je meteen: welke scores vaak voorkomen en
welke bijna niet voorkomen. Dus: een enorme lijst met getallen verandert
in een duidelijk overzicht.
Centrale tendentie: wat is de “typische” score?
Nu wil je weten: “Wat is ongeveer de normale score?” Dat noemen we de
centrale tendentie. Daarvoor zijn drie bekende maten: gemiddelde,
mediaan & modus. De belangrijkste is meestal het gemiddelde. Het
gemiddelde bereken je door: alle scores op te tellen en te delen door het
aantal scores. Bijvoorbeeld: 2 + 4 + 4 = 10. = 3,33. Dus gemiddeld
is de score 3,33.
Spreiding: hoe verschillend zijn mensen?
Alleen een gemiddelde zegt niet alles. Kijk maar: Groep A: 5 5 5 5 5; Groep
B: 1 3 5 7 9. Gemiddelde is bij beide groepen 5. Maar groep B verschilt
veel meer van elkaar. Dat noemen we spreiding. Belangrijke maten
hiervoor zijn: range, variantie & standaarddeviatie.
Variantie en standaarddeviatie
,Dit vinden veel studenten lastig, maar het idee is eigenlijk simpel. Je kijkt:
“Hoe ver zitten scores gemiddeld van het gemiddelde af?”. Als iedereen
dicht bij het gemiddelde zit:
→ kleine spreiding. Als scores heel verschillend zijn: → grote spreiding. De
standaarddeviatie is gewoon een handige maat daarvoor. Dus onthoud
simpel: kleine SD = mensen lijken op elkaar en grote SD = mensen
verschillen veel.
Waarom hebben we inferentiële statistiek nodig?
Beschrijvende statistiek beschrijft alleen je steekproef. Maar onderzoekers
willen méér. Ze willen iets zeggen over de hele populatie. Daarvoor
gebruik je: inferentiële statistiek. Dat betekent eigenlijk: “Van steekproef →
conclusie over populatie.”
Hypothese toetsen: het hart van statistiek
Nu komt het belangrijkste onderdeel van het vak. Stel: je denkt dat het
gemiddelde van een populatie 2,5 is. Maar je steekproefgemiddelde is 2,9.
Dan vraag je je af: “Is dit verschil gewoon toeval? Of is er écht iets aan de
hand?” Daarvoor gebruik je een hypothesetoets.
H0 en H1
Je maakt altijd twee hypotheses. H0 = nulhypothese Dit betekent meestal:
“er is geen verschil” of “er gebeurt niets bijzonders”. Bijvoorbeeld: H0: μ =
2.5. Dus:
het populatiegemiddelde is 2,5. H1 = alternatieve hypothese. Dit is wat de
onderzoeker eigenlijk verwacht. Bijvoorbeeld: H1: μ ≠ 2.5 Dus: het
gemiddelde is NIET 2,5.
Belangrijke regel
Bijna altijd geldt: H0 bevat een = en H1 bevat de verwachting.
De vier stappen van toetsen
Stap 1: hypotheses maken
Bijvoorbeeld: H0: μ = 2.5 en H1: μ ≠ 2.5
Stap 2: kies α (alpha)
Meestal: α = 0.05. Dat betekent: “We accepteren maximaal 5% kans op
een verkeerde conclusie.”
Stap 3: bereken de p-waarde
Dat doet SPSS meestal voor je. De p-waarde vertelt: “Hoe waarschijnlijk is
mijn resultaat als H0 waar is?”
,Stap 4: conclusie
Nu vergelijk je: p met α. Regel: p ≤ 0.05 → H0 verwerpen & p > 0.05 → H0
niet verwerpen.
Wat betekent een p-waarde nou écht?
Dit is superbelangrijk. Veel studenten leren het trucje, maar begrijpen het
niet. Dus simpel: De p-waarde zegt: “Hoe vreemd is mijn resultaat als H0
klopt?”. Kleine p-waarde: → resultaat is erg vreemd onder H0 → dus H0
vertrouwen we niet meer. Grote p-waarde: → resultaat is best normaal
onder H0 → dus H0 houden we voorlopig aan.
Eénzijdig en tweezijdig toetsen
Tweezijdig
Je kijkt: “Is het anders?”. Dus: groter OF kleiner. Bijvoorbeeld: H1: μ ≠ 2.5.
Eénzijdig
Je kijkt maar één kant op. Bijvoorbeeld: H1: μ > 2.5 of H1: μ < 2.5. SPSS
geeft standaard tweezijdige p-waardes. Dus bij eenzijdige toetsen moet je
soms aanpassen.
Betrouwbaarheidsinterval (BI)
Dit vinden docenten heel belangrijk. Een betrouwbaarheidsinterval zegt:
“Waar denken we dat de echte populatiewaarde ligt?” Bijvoorbeeld: 95%-
BI = [2.1 ; 3.4]. Dan denk je: “Met 95% vertrouwen ligt het echte
gemiddelde ergens tussen 2.1 en 3.4.”. Niet: “95% kans dat μ daarin zit.”.
Dat zeggen studenten vaak fout.
Relatie tussen BI en hypothesetoets
Dit is een favoriete tentamenvraag. Regel: ligt de H0-waarde BINNEN het
BI?
→ H0 niet verwerpen & ligt de H0-waarde BUITEN het BI? → H0 wel
verwerpen. Dus BI en hypothesetoets vertellen eigenlijk hetzelfde verhaal.
t-toetsen
In deze cursus zijn t-toetsen heel belangrijk. Een t-toets kijkt of
gemiddelden verschillen. Bijvoorbeeld: verschillen mannen en vrouwen?
Werkt therapie beter dan geen therapie?
Independent samples t-test
Dit gebruik je bij: twee verschillende groepen. Bijvoorbeeld: mannen
versus vrouwen. De vraag is dan: “Zijn de gemiddelden verschillend?”.
Levene’s test
, Deze test kijkt of spreidingen gelijk zijn. SPSS geeft: “equal variances
assumed” en “equal variances not assumed”. Je moet eerst naar Levene’s
test kijken om te weten welke rij je gebruikt.
HOORCOLLEGE 2
In het vorige college heb je geleerd hoe onderzoekers kijken of groepen
van elkaar verschillen. Bijvoorbeeld: Zijn mannen en vrouwen
verschillend? Werkt een therapie? Helpt een medicijn? Daar gebruikten we
toetsen voor, zoals de t-toets. Maar nu komt de volgende stap. Want
onderzoekers willen niet alleen weten: “Is er een verschil?” Ze willen ook
weten: Hoe groot is dat verschil eigenlijk? Hoe zeker kunnen we dat
verschil vinden? Wat als we meer dan twee groepen vergelijken? En
precies daar gaat dit college over.
Power — hoe goed is een toets in het vinden van een echt effect?
Stel: Er zijn echt minder politieagenten op straat. Daardoor wordt het
minder veilig. Dus in werkelijkheid bestaat er écht een effect. Maar soms
vindt een onderzoek dat effect niet. Waarom? Omdat statistiek nooit
perfect is. Onderzoekers kunnen twee soorten fouten maken.
Twee belangrijke fouten
Type I fout. Dit betekent: Je denkt dat er een effect is… maar eigenlijk
bestaat het effect helemaal niet. Dus: je verwerpt H0 terwijl H0 eigenlijk
waar is. Dit is een “vals alarm”. Bijvoorbeeld: je denkt dat een medicijn
werkt, maar eigenlijk werkt het niet. De kans hierop noemen we: α (alpha).
Vaak: α = 0.05. Dus: 5% kans op een vals alarm.
Type II fout. Nu het omgekeerde. Er bestaat WEL een effect… maar jij vindt
het niet. Dus: H1 is eigenlijk waar, maar jij houdt H0 aan. Bijvoorbeeld: een
therapie helpt echt, maar jouw onderzoek ziet dat niet. De kans hierop
heet: β (beta).
Power
En nu komt het belangrijkste idee. Power = kans dat je een écht effect
ontdekt. Dus: “Als H1 waar is, hoe groot is dan de kans dat mijn toets dat
ook vindt?”. Power = 1 – β. Hoge power = goed. Waarom? Omdat je dan
een grote kans hebt om echte effecten te vinden.
Wat beïnvloedt power?
Er zijn vier belangrijke dingen.
1. Steekproefgrootte (N)
Heel belangrijk. Meer mensen in je onderzoek → hogere power. Waarom?
Omdat je gemiddelden stabieler worden. Met weinig mensen is alles