EXPERIMENTELE
ONDERZOEKSMETHODEN
Semester 2
COLLEGE 1
SAMENVATTING STOF EERDERE CURSUSSEN
BESCHRIJVENDE STATISTIEK
Beschrijvende data: samenvatten van data van de gehele populatie
Verdeling van scores maken
Steekproefgrootheden
Data: numerieke gegevens van een populatie of steekproef
Populatie: alle leden van gedefinieerde groep, Griekse letters om parameters weer te
geven
Steekproef: deelverzameling van leden en gedefinieerde groep, Latijnse letters om
steekproefgrootheden weer te geven
Verdeling
Data samenvatten door groeperen van data met dezelfde score d.m.v.
frequentieverdeling of histogram
In frequentieverdeling; valid percent = percentage met missende waardes niet
meegenomen
Steekproefgrootheden
Data samenvatten door kenmerkende eigenschappen van de verdeling van de data
Centrale tendentie: meest kenmerkende score van de verdeling
Gemiddelde, mediaan (middelste) en modus (meest voorkomende)
Spreiding: afwijking van scores van meest kenmerkende score
Range, variantie en standaarddeviatie
Variantie = som van gekwadrateerde deviatiescores gedeeld door N-1
INFERENTIËLE STATISTIEK
Op basis van een steekproef een uitspraak proberen te doen over de populatie
hypothese toetsen/puntschatten/intervalschatten
Hypothese toetsen
Nagaan of het gemiddelde in de populatie gelijk is aan een bepaalde waarde of niet
uitsluitend (slechts 1 juiste hypothese) en uitputtend (alle opties zijn gedekt)
1) Formuleren hypotheses H0 en H1; H0 is de hypothese die je toets, H1 is slechts de
verwachting
2) Beslissingsregel bepalen (alfa level)
3) P-waarde bepalen uit output
, 4) Beslissen over significantie en inhoudelijke conclusie
Eenzijdige hypothese toets: slechts naar 1 kant van de verdeling kijken, H1 zegt dat p
> of < dan alfa
bij overeenstemming p = sig/2, bij niet overeenstemming p = 1 - sig/2
Tweezijdige hypothese toets: kijkt naar beide kanten van de verdeling, H1 zegt dat p ≠
alfa
Puntschatten
Wat is de beste gok voor de parameter?
welke waarde ligt het dichtste bij de waarde in de populatie?
Steekproefgrootheid is beste gok voor parameter
Intervalschatten
Betrouwbaarheidsinterval: wat is het interval waarbinnen de waarde van de
parameter met “% zekerheid zich bevindt?
Als μ niet in interval ligt, mag je H0 wel verwerpen
Toetsen
Z-toets: met bekende σ
T-toets: met onbekende σ
COLLEGE 2
ONDERSCHEIDEND VERMOGEN/POWER
Type 1 fout: H0 verwerpen terwijl deze klopt (α)
Type 2 fout: H0 aanhouden terwijl H0 niet klopt (β)
Power: zekerheid dat H1 waar is wanneer H0 verwerpt wordt (1-β)
Onderscheidend vermogen/power: de kans op het verwerpen van de nulhypothese
als deze in werkelijkheid niet waar is, impliceert een hoge kans op terecht
verwerpen van nulhypothese
Power van een Z-toets bepalen:
Stappenplan:
1. Bepaal de Zcv onder Ho (gegeven α en richting van toets) met tabel B2
σ
2. Bereken standaardfout σ X =
√Ν
3. Bereken kritieke grenswaarde: X CV =μ H 0 + ZCV ∗σ X
X CV −μ H1
4. Reken kritieke grenswaarde om naar de ZH1-waarde; Z H 1=
σX
5. Zoek bijbehorende oppervlakte in tabel B.1
Als X CV tussen μ1 en μ2 valt > kijken naar body; als buiten valt > kijken naar tail
Kans op juiste beslissing wil je zo hoog mogelijk dus:
α klein
Power (1-β) hoog
4 factoren die power verhogen: hoge α, hoge N, lage σ, groter verschil tussen μH0 en μH1
, EFFECTGROOTTE
Statistisch significant ≠ effect
als N laag is, vermogen toets laag, statistisch niet significant, effect groot
als N hoog is, vermogen toets hoog, statistisch wel significant, effect laagx
2 maten voor effectgrootte bij vergelijken gemiddelden:
1. Cohen’s d; hoe groot is het relatieve verschil in groepen?
2. (Partiele) verklaarde variantie η2; hoeveel variantie wordt door
groepslidmaatschap verklaard?
berekenen door SS van groep die je wilt te delen door zelfde SS + SS van error
Grotere effectgrootte = groter verschil tussen groepsgemiddelden
Vuistregels interpreteren effectgrootte:
d η2
Klein 0.2 0.01
Middelgroot 0.5 0.06
Groot 0.8 0.14
Formules:
1 groep:
d=t
√ 1
N
met t = t-waarde
2 groepen:
d=t
√ 1
+
1
N1 N2
groepen
met N1 en N2 zijn steekproefgroottes van verschillende
t2
η2 = 2 met df w = vrijheidsgraden (= N1+N2-2), bij 2 groepen: σ1=σ2
t + df w
ANOVA
1-weg variantieanalyse; gemiddelden van (experimentele) groepen vergelijken
t-toets vergelijkt 2 gemiddelden, ANOVA 2 of meer
Terminologi:
Between-subjects design in elke conditie is er een onafhankelijke steekproef
Within-subjects/repeated measures design: proefpersonen kunnen blootgesteld
worden aan meerdere condities
Factoren: categorische, onafhankelijke variabelen (bijv. leeftijd)
factorial design: design met meerdere factoren
niveaus: categorieën van de factoren (bijv. 12-18 jaar)
conditie: combinatie van niveaus (bijv. 12-18 jaar + vrouw)
ONDERZOEKSMETHODEN
Semester 2
COLLEGE 1
SAMENVATTING STOF EERDERE CURSUSSEN
BESCHRIJVENDE STATISTIEK
Beschrijvende data: samenvatten van data van de gehele populatie
Verdeling van scores maken
Steekproefgrootheden
Data: numerieke gegevens van een populatie of steekproef
Populatie: alle leden van gedefinieerde groep, Griekse letters om parameters weer te
geven
Steekproef: deelverzameling van leden en gedefinieerde groep, Latijnse letters om
steekproefgrootheden weer te geven
Verdeling
Data samenvatten door groeperen van data met dezelfde score d.m.v.
frequentieverdeling of histogram
In frequentieverdeling; valid percent = percentage met missende waardes niet
meegenomen
Steekproefgrootheden
Data samenvatten door kenmerkende eigenschappen van de verdeling van de data
Centrale tendentie: meest kenmerkende score van de verdeling
Gemiddelde, mediaan (middelste) en modus (meest voorkomende)
Spreiding: afwijking van scores van meest kenmerkende score
Range, variantie en standaarddeviatie
Variantie = som van gekwadrateerde deviatiescores gedeeld door N-1
INFERENTIËLE STATISTIEK
Op basis van een steekproef een uitspraak proberen te doen over de populatie
hypothese toetsen/puntschatten/intervalschatten
Hypothese toetsen
Nagaan of het gemiddelde in de populatie gelijk is aan een bepaalde waarde of niet
uitsluitend (slechts 1 juiste hypothese) en uitputtend (alle opties zijn gedekt)
1) Formuleren hypotheses H0 en H1; H0 is de hypothese die je toets, H1 is slechts de
verwachting
2) Beslissingsregel bepalen (alfa level)
3) P-waarde bepalen uit output
, 4) Beslissen over significantie en inhoudelijke conclusie
Eenzijdige hypothese toets: slechts naar 1 kant van de verdeling kijken, H1 zegt dat p
> of < dan alfa
bij overeenstemming p = sig/2, bij niet overeenstemming p = 1 - sig/2
Tweezijdige hypothese toets: kijkt naar beide kanten van de verdeling, H1 zegt dat p ≠
alfa
Puntschatten
Wat is de beste gok voor de parameter?
welke waarde ligt het dichtste bij de waarde in de populatie?
Steekproefgrootheid is beste gok voor parameter
Intervalschatten
Betrouwbaarheidsinterval: wat is het interval waarbinnen de waarde van de
parameter met “% zekerheid zich bevindt?
Als μ niet in interval ligt, mag je H0 wel verwerpen
Toetsen
Z-toets: met bekende σ
T-toets: met onbekende σ
COLLEGE 2
ONDERSCHEIDEND VERMOGEN/POWER
Type 1 fout: H0 verwerpen terwijl deze klopt (α)
Type 2 fout: H0 aanhouden terwijl H0 niet klopt (β)
Power: zekerheid dat H1 waar is wanneer H0 verwerpt wordt (1-β)
Onderscheidend vermogen/power: de kans op het verwerpen van de nulhypothese
als deze in werkelijkheid niet waar is, impliceert een hoge kans op terecht
verwerpen van nulhypothese
Power van een Z-toets bepalen:
Stappenplan:
1. Bepaal de Zcv onder Ho (gegeven α en richting van toets) met tabel B2
σ
2. Bereken standaardfout σ X =
√Ν
3. Bereken kritieke grenswaarde: X CV =μ H 0 + ZCV ∗σ X
X CV −μ H1
4. Reken kritieke grenswaarde om naar de ZH1-waarde; Z H 1=
σX
5. Zoek bijbehorende oppervlakte in tabel B.1
Als X CV tussen μ1 en μ2 valt > kijken naar body; als buiten valt > kijken naar tail
Kans op juiste beslissing wil je zo hoog mogelijk dus:
α klein
Power (1-β) hoog
4 factoren die power verhogen: hoge α, hoge N, lage σ, groter verschil tussen μH0 en μH1
, EFFECTGROOTTE
Statistisch significant ≠ effect
als N laag is, vermogen toets laag, statistisch niet significant, effect groot
als N hoog is, vermogen toets hoog, statistisch wel significant, effect laagx
2 maten voor effectgrootte bij vergelijken gemiddelden:
1. Cohen’s d; hoe groot is het relatieve verschil in groepen?
2. (Partiele) verklaarde variantie η2; hoeveel variantie wordt door
groepslidmaatschap verklaard?
berekenen door SS van groep die je wilt te delen door zelfde SS + SS van error
Grotere effectgrootte = groter verschil tussen groepsgemiddelden
Vuistregels interpreteren effectgrootte:
d η2
Klein 0.2 0.01
Middelgroot 0.5 0.06
Groot 0.8 0.14
Formules:
1 groep:
d=t
√ 1
N
met t = t-waarde
2 groepen:
d=t
√ 1
+
1
N1 N2
groepen
met N1 en N2 zijn steekproefgroottes van verschillende
t2
η2 = 2 met df w = vrijheidsgraden (= N1+N2-2), bij 2 groepen: σ1=σ2
t + df w
ANOVA
1-weg variantieanalyse; gemiddelden van (experimentele) groepen vergelijken
t-toets vergelijkt 2 gemiddelden, ANOVA 2 of meer
Terminologi:
Between-subjects design in elke conditie is er een onafhankelijke steekproef
Within-subjects/repeated measures design: proefpersonen kunnen blootgesteld
worden aan meerdere condities
Factoren: categorische, onafhankelijke variabelen (bijv. leeftijd)
factorial design: design met meerdere factoren
niveaus: categorieën van de factoren (bijv. 12-18 jaar)
conditie: combinatie van niveaus (bijv. 12-18 jaar + vrouw)