10 november 2025
Waar gaat statistische modellen 1 over?
Terugblik naar inleiding onderzoek
Beschrijven van één variabele:
- Centrum (bijv. gemiddelde)
- Spreiding (bijv. standaarddeviatie)
- Verdeling (bijv. histogram)
Voorbeelden voor het beschrijven van een samenhang tussen 2 variabelen:
- Correlatie
- Spearman’s rho
Inferentiële statistiek
Houdt zich bezig met het generaliseren van
uitkomsten. De informatie uit een steekproef wordt
gebruikt om iets te kunnen zeggen over de gehele
populatie.
Veel onderzoeken zijn gebaseerd op steekproeven,
maar er worden toch vaak uitspraken gemaakt over
een grotere groep.
Het is niet mogelijk om de hele populatie te bereiken, daarom trekken we een steekproef.
De steekproef berekent een gemiddelde en met dat gemiddelde kan er iets worden gezegd over de
hele populatie.
Terminologie (begrippen)
Populatie: Groep waarin we geïnteresseerd zijn, maar die we nooit in zijn geheel kunnen bereiken. →
Alle groep 8 leerlingen in Nederland
Parameter: Een numerieke samenvatting van een eigenschap in een populatie, zoals een proportie of
gemiddelde. → Gemiddelde aantal huiswerkuren van groep 8 leerlingen in Nederland
Steekproef: Selecte groep mensen uit een populatie bij wie het onderzoek wordt uitgevoerd. → 43
groep 8 leerlingen van drie Groningse basisscholen
Statistiek: Een numerieke samenvatting van een eigenschap in een steekproef die wordt gebruikt om
de parameter te schatten, zoals steekproefgemiddelde. → Gemiddelde aantal huiswerkuren van de
43 onderzochte groep 8 leerlingen
1
,Symbolen
Griekse letter → Populatie.
Nederlandse letter → steekproef.
Onthouden!! Dit tabelletje komt
niet op het tentamen.
Steekproef en representativiteit
Representatieve steekproef
Belangrijk om altijd te kijken of het een goed beeld schetst van de hele populatie.
Beste is om je deelnemers random te selecteren. In veel onderzoeken is hier alleen geen sprake van.
Meer is niet altijd beter. Het gaat om representativiteit.
Voorbeeld van een representatieve steekproef
Onderzoeksvraag: Wat is gemiddelde leestijd van 9-jarige kinderen in Groningen?
De onderzoeker wil iets weten over de populatie: Alle 9-jarige kinderen in Groningen
Steekproef is dan een selectie van 9-jarige kinderen uit de stad Groningen
Welke steekproef is representatief?
a) Alle 9-jarige leerlingen van vier Groningse basisscholen.
b) 200 random 9-jarige leerlingen van alle Groningse basisscholen.
Antwoord:
b) Deze manier is willekeuriger en daarom representatiever
Aanvulling op het voorbeeld
Zijn 4 scholen representatief voor alle Groningse basisscholen? Dit verschilt per situatie. Het is niet
meteen fout, je kan alleen niet te snel conclusies trekken.
- Ja: populatie = alle 9-jarige leerlingen in Groningen
- Nee: populatie = selectie van 9-jarige leerlingen in Groningen
Zijn 4 scholen representatief voor alle basisscholen in Noord-Nederland?
- Ja: populatie = alle 9-jarige leerlingen in Noord-Nederland
2
,Steekproevenverdeling (4.4)
Relevantie kansrekening
Gaat uit van random gebeurtenissen.
Voorspelt regelmaat op lange termijn random gebeurtenissen.
Er kan bijvoorbeeld worden voorspelt hoe groot de kans op een
meisje is bij het krijgen van 4 kinderen.
Kansverdeling
Geeft aan wat er gebeurt op de lange termijn → “Wat als ik heel vaak een steekproef zou trekken?”
Steekproeftrekking is ook een random gebeurtenis.
Kansrekening wordt gebruikt om op basis van een steekproef kansuitspraken te doen over de
volledige populatie.
Steekproevenverdeling (sampling distribution)
Steekproevenverdeling: Wordt gebruikt
om te kijken wat er zou gebeuren als een
steekproef heel vaak herhaalt wordt.
Random variabele: Iedere steekproef heeft
(net) een andere uitkomst. Het ligt allemaal
rond het populatiegemiddelde (9).
Populatiegemiddelde: Kan worden berekent door heel veel steekproeven te trekken en door
vervolgens van al die steekproeven het gemiddelde te berekenen.
Conclusie
Als we een samenvattingsmaat gebruiken (zoals een gemiddelde of proportie) dan is de uitkomt bijna
altijd ongelijk aan het populatiegemiddelde/proportie.
Het is niet erg als het iets afwijkt, dat is logisch.
Belangrijk om de mate van onzekerheid aan te geven → Betrouwbaarheidsinterval.
3
, Steekproevenverdeling voor gemiddeldes (4.5)
Steekproevenverdeling kan voor iedere statistiek
Proportie en gemiddelde
Correlatie
Regressiecoëfficiënt
Gevolgen van heel vaak een steekproef trekken
Gemiddelde steekproevenverdeling staat gelijk aan het populatiegemiddelde.
Steekproefgemiddelden variëren minder dan de losse scores in de populatie.
Verdeling van steekproefgemiddelden is minder breed en meer normaal verdeeld.
Ondanks een scheve populatieverdeling, krijg je alsnog een normaal verdeelde steekproevenverdeling.
Algemeen geldende regels
Verdeling van steekproefgemiddelden is NIET hetzelfde als de verdeling van scores in de populatie.
Variantie van steekproefgemiddelden is KLEINER dan de variantie van scores in een populatie.
Gemiddelde van steekproefgemiddelden is HETZELFDE als gemiddelde van scores in populatie.
Naarmate je n groter wordt (grotere steekproef), lijkt de steekproevenverdeling steeds meer op een
normale verdeling = Centrale limietstelling (Central limit theorem).
Normaalverdeling steekproef
Als de populatie exact normaal verdeeld is, is het steekproefgemiddelde ook exact normaal verdeeld.
Als de populatie niet normaal verdeeld is en n is groot, dan is het steekproefgemiddelde ongeveer
normaal verdeeld.
Gemiddelde van de steekproevenverdeling = Populatiegemiddelde:
Spreiding van de steekproevenverdeling:
Standaardfout
De standaardfout is niet hetzelfde als de standaarddeviatie.
Standaarddeviatie: Maat voor spreiding van individuele metingen in een steekproef of populatie.
Standaardfout: Maat voor spreiding tussen steekproefuitkomsten / steekproevenverdeling. Geeft aan
hoeveel spreiding er is tussen alle gemiddeldes in een steekproevenverdeling.
4