Aantekeningen
HC 1 2-2-2026
Test
Relatie tussen X en Y?
R^2 = correlatie in het kwadraat, verklaarde variantie
80% is de correlatie tussen de 2 R = 0,9 (best hoog)
Regressielijn heeft een relatie met de correlatie
Er is een relatie tussen deze 2 variabelen
Je kan hier niet concluderen of er een relatie is tussen X en Y je moet weten
wat X en Y zijn.
X = aantal piraten op aarde
Y = gemiddelde temperatuur op aarde (graden)
Lijkt een correlatie te zijn, want 0,9 maar er is geen causaliteit.
Correlatie statistische maat, gaat over 2 getallen.
Relatie relatie tussen 2 dingen, hangt van X en Y af.
Er is een negatieve relatie.
Statistische relatie tussen X en Y maar geen daadwerkelijke relatie
Daadwerkelijke relatie concluderen op basis van statistische gegevens je hebt
onderliggende theorie nodig.
Kan gecorrigeerd worden door de derde variabele (partiële correlatie).
Een statistische relatie is niet hetzelfde als een relatie.
Statistisch verband (data/meting) ≠ daadwerkelijk verband (interpretatie adhv
theorie).
Rol van statistische analyse in onderzoek
(Wetenschappelijk) onderzoek
Idee: verband
Hypothesen opstellen dingen uitsluiten hypothese in woorden en
statistische hypothese.
Deze ‘vertalen’ in testbare/meetbare hypothesen ( = operationalisatie)
Meten
Gemeten data analyseren
Feitelijke meetresultaten interpreteren adhv theorie
Communiceren / rapporteren
Statistische uitkomsten kunnen slechts interpretatie ondersteunen (..of niet in
hoeverre?)
Statistiek-kennis is essentieel bij lezen/interpreteren/evalueren/rapporteren van
onderzoek in een verslag/artikel.
,Waarom statistiek?
(Wetenschappelijk) onderzoek gaat om verbanden leggen tussen variabelen
Is een verband (bv. een verschil) in gemeten data betekenisvol
(significant)? En zo ja, in welke mate? statistisch toetsen
Statistische methoden/toetsen: in welke mate de totale spreiding in de
gemeten uitkomsten systematisch is (en niet-systematisch).
Systematische spreiding: bijv. verschillende gewicht man/vrouw verschillend
gewicht relateren aan man en vrouw zijn het is een soort van ratio.
Maw: in hoeverre de gemeten waarden systematisch variëren a.f.v. een bepaalde
andere grootheid/-heden.
Spreiding: voorbeeld 1
Zie ppt
Gemiddelden nemen
Waarden x – gemiddelde x van de groep in het kwadraat in het kwadraat
omdat er zowel positieve als negatieve afwijkingen zijn som nemen
delen door aantal waarnemingen – 1 is de variantie, statistische
uitkomstmaat die iets zegt over de mate van spreiding rond het
gemiddelde.
Dit kun je ook voor y doen.
Statistische methoden/toetsen: in welke mate de totale spreiding in de
uitkomsten systematisch is en niet-systematisch.
Spreiding: voorbeeld 2
Zie ppt
In hoeverre zijn de spreidingen gelijk aan elkaar kijken naar gezamenlijke
spreiding.
SBD tegen DBD
Passende lijn ertussen trekken regressielijn.
Alle afwijkingen van de regressielijn is de niet-gezamenlijke (niet-
systematische) spreiding
Lijn is de gezamenlijke (systematische) spreiding
Hoe smaller hoe beter passend model je hebt dus hoe minder punten
afwijken.
Waarom statistiek
Dus: leren toepassen stat. Methoden (in SPSS, R, etc), maar vooral ook
leren waarom (ivm keuzes maken, de ene doet het ene en de andere het
andere), en interpreteren van data (obv theoretische kennis).
, Computer(software) kan berekenen, maar niet de resultaten interpreteren!
(zie ook Field H. 8.7)
Correlatie
2 soorten
Pearson correlatiecoëfficiënt
Spearman’s rho (rangcorrelatiecoëfficiënt) eerst een rangorde
maken
Spreidingsdiagram
Er is een lineair verband pearson correlatie kan je berekenen
Gezamenlijke spreiding (ofwel: co-variantie)
Co-variantie zie formule ppt.
Geen lineair verband (kromming) geen pearson correlatie kan je berekenen.
Hier: Spearman correlatie
Maakt gebruik van rangscores (is altijd lineair)
Waarde omzetten en dan pearson correlatiecoëfficiënt (is dezelfde
formule)
Pearson correlatie
Bij 2 variabelen van minimaal interval meetniveau
Lineair verband (met spreidingsdiagram te controleren)
r = spreiding systematisch (gezamenlijk) / spreiding totaal
Boven streep gezamenlijk covariantie
Eronder staat de totale variantie
rxy = cov xy / sx maal sy kan alleen een waarde zijn tussen 1 en -1.
-1 ≤ r ≤ 1
Als hij 0 is, is er geen gezamenlijke spreiding.
Correlaties
Zie ppt
Het maakt niet uit wat de richtingscoëfficiënt is, de correlatie blijft 1.
Horizontale lijn correlatie is 0 als x groter wordt, blijft y gelijk (geen
correlatie).
Als correlatie 0 is, kun je geen lineaire methode gebruiken, maar alleen niet-
lineaire methode, pearson kun je dan niet gebruiken.
Één afwijkende waarde heeft veel invloed op je uitkomstmaat.
, Correlatie = (causale) relatie?
Statistiek (data) vs interpretatie (theorie)
Voorbeeld adhv onafhankelijke t-toets
Hypothese: jongens lager vetpercentage dan meisjes
Statistische hypothese? zie ppt (wel Griekse symbolen)
Onafhankelijke t-toets
Toetst of de gemiddelden van een variabele in twee onafhankelijke steekproeven
zodanig van elkaar verschillen dat ze redelijkerwijs niet uit twee populaties
afkomstig zijn die hetzelfde gemiddelde hebben.
Vooronderstellingen onafhankelijke t-toets
Waarnemingen aselect (random steekproef, niet van tevoren bepalen) en
onafhankelijk
Twee onafhankelijke steekproeven
Afhankelijke variabele minstens interval meetniveau en…
waarden afhankelijke variabele normaal verdeeld (in elke groep)
σ (spreiding hele populatie)onbekend
Histogram met normaalcurve
Kengetallen
Onderzoeken verdeling op basis van kengetallen
Op basis van steekproefgegevens
Bij perfect normale verdeling van data:
Gemiddelde = mediaan = modus
99,7% van de waarnemingen binnen 3 standaarddeviaties van
gemiddelde
Skewness = 0
Kurtosis = 0
Skewness is maat voor scheefheid
Kurtosis is maat voor platheid
Week 1
H1.7.1 Frequency distributions
Zodra je gegevens hebt verzameld, is het erg handig om te plotten hoe vaak elke
score voorkomt.
Een frequentieverdeling, of histogram, plot de waarden van de waarnemingen op
de horizontale as, met een balk waarvan de hoogte aangeeft hoe vaak elke
waarde in de dataset voorkwam.
Frequentieverdelingen zijn erg nuttig voor het beoordelen van
eigenschappen van de verdeling van scores.
HC 1 2-2-2026
Test
Relatie tussen X en Y?
R^2 = correlatie in het kwadraat, verklaarde variantie
80% is de correlatie tussen de 2 R = 0,9 (best hoog)
Regressielijn heeft een relatie met de correlatie
Er is een relatie tussen deze 2 variabelen
Je kan hier niet concluderen of er een relatie is tussen X en Y je moet weten
wat X en Y zijn.
X = aantal piraten op aarde
Y = gemiddelde temperatuur op aarde (graden)
Lijkt een correlatie te zijn, want 0,9 maar er is geen causaliteit.
Correlatie statistische maat, gaat over 2 getallen.
Relatie relatie tussen 2 dingen, hangt van X en Y af.
Er is een negatieve relatie.
Statistische relatie tussen X en Y maar geen daadwerkelijke relatie
Daadwerkelijke relatie concluderen op basis van statistische gegevens je hebt
onderliggende theorie nodig.
Kan gecorrigeerd worden door de derde variabele (partiële correlatie).
Een statistische relatie is niet hetzelfde als een relatie.
Statistisch verband (data/meting) ≠ daadwerkelijk verband (interpretatie adhv
theorie).
Rol van statistische analyse in onderzoek
(Wetenschappelijk) onderzoek
Idee: verband
Hypothesen opstellen dingen uitsluiten hypothese in woorden en
statistische hypothese.
Deze ‘vertalen’ in testbare/meetbare hypothesen ( = operationalisatie)
Meten
Gemeten data analyseren
Feitelijke meetresultaten interpreteren adhv theorie
Communiceren / rapporteren
Statistische uitkomsten kunnen slechts interpretatie ondersteunen (..of niet in
hoeverre?)
Statistiek-kennis is essentieel bij lezen/interpreteren/evalueren/rapporteren van
onderzoek in een verslag/artikel.
,Waarom statistiek?
(Wetenschappelijk) onderzoek gaat om verbanden leggen tussen variabelen
Is een verband (bv. een verschil) in gemeten data betekenisvol
(significant)? En zo ja, in welke mate? statistisch toetsen
Statistische methoden/toetsen: in welke mate de totale spreiding in de
gemeten uitkomsten systematisch is (en niet-systematisch).
Systematische spreiding: bijv. verschillende gewicht man/vrouw verschillend
gewicht relateren aan man en vrouw zijn het is een soort van ratio.
Maw: in hoeverre de gemeten waarden systematisch variëren a.f.v. een bepaalde
andere grootheid/-heden.
Spreiding: voorbeeld 1
Zie ppt
Gemiddelden nemen
Waarden x – gemiddelde x van de groep in het kwadraat in het kwadraat
omdat er zowel positieve als negatieve afwijkingen zijn som nemen
delen door aantal waarnemingen – 1 is de variantie, statistische
uitkomstmaat die iets zegt over de mate van spreiding rond het
gemiddelde.
Dit kun je ook voor y doen.
Statistische methoden/toetsen: in welke mate de totale spreiding in de
uitkomsten systematisch is en niet-systematisch.
Spreiding: voorbeeld 2
Zie ppt
In hoeverre zijn de spreidingen gelijk aan elkaar kijken naar gezamenlijke
spreiding.
SBD tegen DBD
Passende lijn ertussen trekken regressielijn.
Alle afwijkingen van de regressielijn is de niet-gezamenlijke (niet-
systematische) spreiding
Lijn is de gezamenlijke (systematische) spreiding
Hoe smaller hoe beter passend model je hebt dus hoe minder punten
afwijken.
Waarom statistiek
Dus: leren toepassen stat. Methoden (in SPSS, R, etc), maar vooral ook
leren waarom (ivm keuzes maken, de ene doet het ene en de andere het
andere), en interpreteren van data (obv theoretische kennis).
, Computer(software) kan berekenen, maar niet de resultaten interpreteren!
(zie ook Field H. 8.7)
Correlatie
2 soorten
Pearson correlatiecoëfficiënt
Spearman’s rho (rangcorrelatiecoëfficiënt) eerst een rangorde
maken
Spreidingsdiagram
Er is een lineair verband pearson correlatie kan je berekenen
Gezamenlijke spreiding (ofwel: co-variantie)
Co-variantie zie formule ppt.
Geen lineair verband (kromming) geen pearson correlatie kan je berekenen.
Hier: Spearman correlatie
Maakt gebruik van rangscores (is altijd lineair)
Waarde omzetten en dan pearson correlatiecoëfficiënt (is dezelfde
formule)
Pearson correlatie
Bij 2 variabelen van minimaal interval meetniveau
Lineair verband (met spreidingsdiagram te controleren)
r = spreiding systematisch (gezamenlijk) / spreiding totaal
Boven streep gezamenlijk covariantie
Eronder staat de totale variantie
rxy = cov xy / sx maal sy kan alleen een waarde zijn tussen 1 en -1.
-1 ≤ r ≤ 1
Als hij 0 is, is er geen gezamenlijke spreiding.
Correlaties
Zie ppt
Het maakt niet uit wat de richtingscoëfficiënt is, de correlatie blijft 1.
Horizontale lijn correlatie is 0 als x groter wordt, blijft y gelijk (geen
correlatie).
Als correlatie 0 is, kun je geen lineaire methode gebruiken, maar alleen niet-
lineaire methode, pearson kun je dan niet gebruiken.
Één afwijkende waarde heeft veel invloed op je uitkomstmaat.
, Correlatie = (causale) relatie?
Statistiek (data) vs interpretatie (theorie)
Voorbeeld adhv onafhankelijke t-toets
Hypothese: jongens lager vetpercentage dan meisjes
Statistische hypothese? zie ppt (wel Griekse symbolen)
Onafhankelijke t-toets
Toetst of de gemiddelden van een variabele in twee onafhankelijke steekproeven
zodanig van elkaar verschillen dat ze redelijkerwijs niet uit twee populaties
afkomstig zijn die hetzelfde gemiddelde hebben.
Vooronderstellingen onafhankelijke t-toets
Waarnemingen aselect (random steekproef, niet van tevoren bepalen) en
onafhankelijk
Twee onafhankelijke steekproeven
Afhankelijke variabele minstens interval meetniveau en…
waarden afhankelijke variabele normaal verdeeld (in elke groep)
σ (spreiding hele populatie)onbekend
Histogram met normaalcurve
Kengetallen
Onderzoeken verdeling op basis van kengetallen
Op basis van steekproefgegevens
Bij perfect normale verdeling van data:
Gemiddelde = mediaan = modus
99,7% van de waarnemingen binnen 3 standaarddeviaties van
gemiddelde
Skewness = 0
Kurtosis = 0
Skewness is maat voor scheefheid
Kurtosis is maat voor platheid
Week 1
H1.7.1 Frequency distributions
Zodra je gegevens hebt verzameld, is het erg handig om te plotten hoe vaak elke
score voorkomt.
Een frequentieverdeling, of histogram, plot de waarden van de waarnemingen op
de horizontale as, met een balk waarvan de hoogte aangeeft hoe vaak elke
waarde in de dataset voorkwam.
Frequentieverdelingen zijn erg nuttig voor het beoordelen van
eigenschappen van de verdeling van scores.