statistiek (VOS)
Introductieles 1
HC1 - Multipele regressie 1
HC2 - Meerweg ANOVA 3
HC3 - ANCOVA 7
HC4 - Herhaalde Metingen en Mixed Design 9
HC5 - Moderatie en mediatieanalyse 12
HC6 - Factoranalyse en betrouwbaarheidsanalyse 14
Definities van validiteit 19
,Kwalitatief onderzoek
Introductieles
Er zijn twee voornamelijke doelstellingen van kwalitatief onderzoek:
● Het analyseren van patronen in hoe mensen sociale fenomenen ervaren,
interpreteren en hoe dit hun handelen beïnvloedt.
● Het generen van gedetailleerde beschrijvingen, inzichten verklaringen en
theoretische modellen van sociale fenomenen.
- Kenmerken van kwalitatief onderzoek:
● Interpretatief: De betekenisgeving vanuit het perspectief van respondenten staat
centraal en onderzoeker interpreteert deze betekenissen.
● Naturalistisch: De onderzoeker is geïnteresseerd in de natuurlijke omgeving van de
respondent (dus niet in een laboratorium setting).
● Reflexief: De onderzoeker reflecteert bewust op hoe bepaalde veronderstellingen,
keuzes, en de onderzoeker het onderzoek beïnvloedt.
De grounded theory is een onderzoeksstrategie en analysemethode waarbij de empirische
observaties/gegevens de basis vormen voor de ontwikkeling van theorie.
● Op basis van een gestructureerde analyse komt de onderzoeker tot theorie: theorie
is verankerd in de data.
● Onderzoek dient theorie te genereren, maar theorie is geen uitgangspunt van
onderzoek maar het resultaat ervan. Het is niet houdbaar.
Kwantitatief onderzoek
HC1 - Multipele regressie
Bij een multipele regressie is er één afhankelijke variabele (Y) in
een padmodel samen met één of meerdere onafhankelijke
variabelen (X) van minimaal interval niveau of dichotoom niveau
= Een nominale variabele die slechts twee waarden kan aannemen (0 of 1).
● Categorisch kenmerk met meer dan twee categorieën, dus nominaal/ordinaal
meetniveau, wordt omgezet in dummyvariabelen.
- Uitspraak bij een padmodel: Voor één stap meer in X verandert er zo veel in Y.
Vergelijking voor geobserveerde Y: Uitkomst (Y) = model (X) + voorspellingsfout
Vergelijking voor het voorspellen van waarde op Y: Geschatte uitkomst (Ŷ) = model (X)
- E, Residuals of Error, geeft de foutmarges weer tussen het model en de realiteit.
● Bij een voorspelling is deze niet nodig, omdat het model zo gemaakt wordt dat de
errors gemiddeld genomen 0 zijn.
○ Gemiddeld is het model goed, maar voor individuen kunnen er fouten zijn.
Verschillende doelen van een multipele regressie analyse:
● Beschrijven van lineaire relaties tussen variabelen (regressiemodel).
● Toetsen van hypothesen over relaties (significantie).
● Kwantificeren van relaties (effectgrootte).
● Kwalificeren van relaties (klein, middelmatig, groot).
● Beoordelen van de relevantie van relaties (subjectief).
● Voorspellen van iemands waarde met regressiemodel (puntschatting en
intervalschatting).
- Op basis van statistische samenhang mogen er geen causale uitspraken gemaakt worden.
1
, Y = afhankelijke variabele (dependent)
X = onafhankelijke variabelen (predictors)
B0 = intercept (constant), ook wel a
B1 = regressiecoëfficiënt (slope)
● Geeft relatie tussen Y en X
E = voorspellingsfout (error of residual)
Vergelijking voor een enkelvoudige regressie: Ŷ = 𝑏0 + 𝑏1𝑋1
● 𝑏0 → intercept of constante (kruising met 0 punt)
● 𝑏1 → regressiecoëfficiënt
Bij het trekken van een passende rechte lijn in een spreidingsdiagram wordt er het ‘kleinste
kwadraten criterium’ toegepast: de lijn waarbij de voorspellingsfout zo klein mogelijk is.
= De afstand tussen de geobserveerde waarde en de voorspelde waarde.
● Of de regressielijn met de kleinste residuele kwadratensom wel degelijk de beste is,
2
kan worden bepaalt met de Goodness-of-fit (𝑅 ).
= Vergelijking (ratio) van lineair model (regressielijn) met basismodel (basislijn).
𝑆𝑆𝑇 = totale kwadratensom
𝑆𝑆𝑀 = kwadratensom van rechte lijn (model)
𝑆𝑆𝑅 = kwadratensom van voorspellingsfout (residual)
SS = Sum of Squares = Som van gekwadrateerde deviaties
Ŷ basismodel: Er is géén relatie tussen de
voorspellers en de waardes op Y.
● Als dat zo is, is de gemiddelde van alle
Y-waardes de beste voorspelling.
- De totale deviatie (t) is de afstand tussen Yi
en het basismodel/nul-model.
- Het verklaarde deel (m) is de afstand tussen
het lineaire model en het basismodel.
● Hier hoort het onverklaarbare deel (r)
bij: afstand van model tot Yi (het residu).
Het gaat om de verhouding in wat het model wel of niet kan verklaren ten opzichte van het
nul-model.
- Elke t, m en r kwadrateren en dan optellen zorgen voor 𝑆𝑆𝑇, 𝑆𝑆𝑀 en 𝑆𝑆𝑅.
2
𝑅 kan worden geïnterpreteerd als de hoeveelheid verklaarde variantie: Hoeveel verschillen
op Y kunnen er worden verklaard door middel van X.
● Het gaat om een proportie dus het ligt altijd tussen 0 en 1
● Het is de kwadratensom van het model gedeeld door de totale kwadratensom.
● Hoe hoger het getal hoe beter het model is.
→ ... procent van de verschillen in scores op Y kan worden verklaard door middel
van X.
- R op zichzelf is de multiple correlatiecoëfficiënt: de relatie tussen de voorspelde Y en de
daadwerkelijk geobserveerde Y.
2