gegevens (TAK)
HC1 - Kwantitatieve analysetechnieken 1
HC2 - Systematic reviews en meta-analyse 6
HC4 - Vragenlijstconstructie 10
HC5 - Factoranalyse 14
HC6 - Multipele lineaire regressie 19
HC7 - Moderatie en mediatie 24
HC 8 - Logistische regressie 27
,HC1 - Kwantitatieve analysetechnieken
Casus: Een onderzoek over lichaamslengte van Nederlandse middelbare scholieren tussen
de 12 en 18 jaar met N=100 (50 meiden, 50 jongens).
● Afhankelijke variabele: lengte in centimeters (ratio)
● Onafhankelijke variabelen:
○ Groepsvariabele (F): geslacht, 1 = jongen en 2 = meisje (nominaal/dichotoom)
■ Dichotoom is een nominale variabele die slechts twee waarden kan
aannemen (0 of 1).
○ Interval variabele X: leeftijd, gemeten in maanden (ratio)
Statistische technieken voor vijf onderzoeksvragen gegeven de verzamelde gegevens:
1. Is de gemiddelde lengte 170 cm?
→ One-Sample t-test voor het toetsen van één gemiddelde
2. Wat is het lengteverschil tussen jongens en meisjes?
→ Independent-Samples t-test voor het toetsen van het verschil tussen twee
gemiddelden.
3. Wat is het groeitempo per maand?
→ Regressieanalyse voor het toetsen van invloed van X op Y.
4. Wat is het lengteverschil tussen jongens en meisjes na correctie voor leeftijd?
→ ANCOVA voor het toetsen van het verschil in gemiddelden gecorrigeerd
voor een covariaat.
5. Is het groeitempo hetzelfde voor jongens en meisjes?
→ ANCOVA met interactie voor het toetsen van homogene regressielijnen.
- Deze technieken zijn bijzondere gevallen van het general linear model (GLM).
= Algemeen model wat kan worden toegepast op alle situaties
waarbij er een continue afhankelijke variabele is en combinaties
van continue en categorische onafhankelijke variabelen.
○ Er worden lineaire relaties verondersteld tussen de
afhankelijke en onafhankelijke variabelen met een mix
van groeps- en continue variabelen.
Vraag 1 met de one-sample t-test
Een nulhypothese toetsing heeft drie stappen:
1. Formuleer de nulhypothese en stel het significantieniveau α, de grenswaarde, vast.
○ Bij een ongerichte alternatieve hypothese is een tweezijdige toetsing waarbij
het verschil beide kanten op kan vallen → ρ ≠ 0
○ Een eenzijdige alternatieve hypothese: ρ < of > 0.
■ De eenzijdige overschrijdingskans is altijd de helft van de tweezijdige
overschrijdingskans.
● Een eenzijdige overschrijdingskans heeft een grotere kans om
de nulhypothese te verwerpen, omdat deze altijd kleiner is.
○ Het populatiegemiddelde is 𝜇 is gelijk aan de testwaarde 𝜇0.
2. Bereken de toetsingsgrootheid en bepaal de overschrijdingskans ρ en
bereken het betrouwbaarheidsinterval.
- Standaardfout SE en toetsingsgrootheid t:
○ De Std. Deviation (standaardafwijking) geeft de
spreiding aan van de gemeten scores.
■ Interpretatie: 166,69 cm is de gemiddelde lengte en 2 x 9,124 = 18,25
(bij 2-tailed?) dus tussen 148 cm en 185 cm zit 95% van de groep.
1
, ○ De Std. Error of the Mean laat de spreiding zien binnen de verdeling van
steekproefgemiddelden.
■ Aldus: Als er oneindig veel steekproeven van 100 getrokken worden
van de populatie, krijg je 100x een gemiddelde. Dit geeft een spreiding
van steekproefgemiddelden, wat de Std. Error Mean is.
■ Berekening: Std.Deviation delen door de wortel van N
■ Interpretatie: Geeft de kans op ons steekproefgemiddelden
binnen de steekproevenverdeling.
○ De T-toets met een testwaarde levert een toetsings-
grootheid op: t.
■ Berekening: Verschil
tussen de testwaarde en het gevonden
gemiddelde, gedeeld door de Std. Error of the Mean.
■ Wat is de kans op het vinden van -3.628 als we ervan uitgaan dat de
nulhypothese (H0 : 𝜇 = 170) waar is? → 0.000 (Sig. 2-tailed).
- Beslissing met overschrijdingskans ρ:
○ Kijkend naar hypothese en de significantie: ρ < .001, dus ρ < α → H0 verwerpen.
- Betrouwbaarheidsinterval:
○ In de one-sample test staat het betrouwbaarheidsinterval (BTI) van het
verschil (MD: -3,310) en laat zien wat de Lower en Upper is daaromheen.
■ Niet binnen een 0? → H0 verwerpen.
○ Interpretatie: Het werkelijke verschil tussen de testwaarde en het populatie-
gemiddelde ligt, op basis van deze steekproefgegevens, met een
betrouwbaarheid van 95% tussen -5.12 en -1.50 (of: 164,88 en 168,50 cm).
→ 95%-BTI populatiegemiddelde: [164.88, 168.50]
○ Het resultaat van veel steekproeven uit dezelfde populatie met een verschil
en een betrouwbaarheidsinterval →
■ Niet elke steekproef zal het daadwerkelijke
verschil bevatten, maar dat zal met een 95%
BTI maar 5% van de gevallen zijn.
■ Kortom, voor een gerealiseerd 95% BTI geldt dat het met 95%
betrouwbaarheid het werkelijke verschil tussen de testwaarde en het
populatiegemiddelde omvat.
3. Beslissing:
○ ρ ≤ α → Verwerp H0 en ρ > α → Verwerp H0 niet
■ ρ geeft de correlatie van de populatie.
■ P-waarde: de kans op het verschil in gemiddelden zoals gevonden in
de steekproef (of groter verschil), onder de aanname dat H0 waar is.
○ Dus als de testwaarde (test value) buiten de betrouwbaarheidsinterval past,
dan H0 verwerpen en als deze er binnen valt, moet H0 niet worden verworpen.
Vraag 1 met het General Linear Model
De regressievergelijking in GLM bij deze vraag met b0 als intercept:
- Bij alle uitgevoerde toetsen zit de ANOVA tabel, waarbij de variantie is opgesplitst in een
aantal bronnen: corrected model, intercept, error, total en corrected total.
● Er wordt bij de toetsingsgrootheid F getoetst of het gemiddelde (B) afwijkt van 0.
○ Bijv: Mean=166, F=33377.5, p=.001 → Intercept wijkt sig. af van 0
● Bij de Parameter Estimates krijg je een schatting van de B.
2