Statistiek 1: week 1
Meetniveaus
Categorisch meetniveau (kwalitatief)
- Nominaal: onderscheidbaar (bijv. zitten/staan/liggen;
lezen/schrijven/computergebruik/overleg) l Dichotoom (ja/nee, man/vrouw)
- Ordinaal: onderscheidbaar + ordening l Rangorde, schaal (bijv. ervaren comfort 1-10)
Numeriek meetniveau (kwantitatief)
- Interval: onderscheidbaar + ordening + vaste meeteenheid + gekozen nulpunt (temperatuur)
- Ratio: onderscheidbaar + ordening + vaste meeteenheid + absoluut nulpunt (bijv. lengte,
gewicht, zitduur)
Frequentieverdeling en kans
- Histogram: Een grafiek met de waardes van de uitkomsten op de x-as. De hoogte van de bars
geeft aan hoe vaak iedere waarde in de dataset voorkomt (frequentieverdeling)
- Uniforme verdeling: alle uitkomsten komen even vaak voor (dobbelsteen)
- Unimodale verdeling: normaal verdeling (een piek)
- Bimodale verdeling: twee pieken
- Multimodale verdeling: meerdere pieken
- Frequentieverdeling is een kansverdeling. Op de y-as staat de relatieve frequentie:
freq/totaal aantal
Z-verdeling
- Verdelingen kunnen variëren in gemiddelde en sd, er zijn dus veel verschillende
normaalverdelingen. Er is maar 1 standaardnormaal verdeling (de z-verdeling).
- Mean = 0 sd = 1
- Z-score: aantal standaarddeviatie units boven of onder het gemiddelde µ =
gemiddelde; 𝜎 = standaarddeviatie; X = uitkomst
- Z zoeken in z-tabel voor linker/rechter overschrijdingskans in %
Normaliteit controleren
- Omdat de dataverdeling bepaalt welke centrummaat een goede afspiegeling geeft van de
data en het bepaalt de statistische methode die je het beste kan gebruiken. Veel statistische
toetsen vereisen dat de data normaal verdeeld is.
- Normaal verdeling symmetrisch: gemiddelde = mediaan = modus
- Scheve verdeling is niet symmetrisch: gemiddelde > mediaan > modus
- Moraal: gemiddelde zegt niets als je geen beeld hebt van de verdeling
- Binnen 1 SD: 68% van alle waarnemingen
- Binnen 1.96 SD: 95% van alle waarnemingen
- Binnen 3 SD: ~100% van alle waarnemingen
- opletten bij: >1 & <-1
Toetsende statistiek
- Populatieparameters zijn bij steekproefonderzoek meestal onbekend
- Steekproefdata verzamelen we en de kengetallen zijn dus bekend
- andere steekproef = ander steekproefresultaat, waarde van de statistic wordt bepaald door
de populatie en door toeval.
Meetniveaus
Categorisch meetniveau (kwalitatief)
- Nominaal: onderscheidbaar (bijv. zitten/staan/liggen;
lezen/schrijven/computergebruik/overleg) l Dichotoom (ja/nee, man/vrouw)
- Ordinaal: onderscheidbaar + ordening l Rangorde, schaal (bijv. ervaren comfort 1-10)
Numeriek meetniveau (kwantitatief)
- Interval: onderscheidbaar + ordening + vaste meeteenheid + gekozen nulpunt (temperatuur)
- Ratio: onderscheidbaar + ordening + vaste meeteenheid + absoluut nulpunt (bijv. lengte,
gewicht, zitduur)
Frequentieverdeling en kans
- Histogram: Een grafiek met de waardes van de uitkomsten op de x-as. De hoogte van de bars
geeft aan hoe vaak iedere waarde in de dataset voorkomt (frequentieverdeling)
- Uniforme verdeling: alle uitkomsten komen even vaak voor (dobbelsteen)
- Unimodale verdeling: normaal verdeling (een piek)
- Bimodale verdeling: twee pieken
- Multimodale verdeling: meerdere pieken
- Frequentieverdeling is een kansverdeling. Op de y-as staat de relatieve frequentie:
freq/totaal aantal
Z-verdeling
- Verdelingen kunnen variëren in gemiddelde en sd, er zijn dus veel verschillende
normaalverdelingen. Er is maar 1 standaardnormaal verdeling (de z-verdeling).
- Mean = 0 sd = 1
- Z-score: aantal standaarddeviatie units boven of onder het gemiddelde µ =
gemiddelde; 𝜎 = standaarddeviatie; X = uitkomst
- Z zoeken in z-tabel voor linker/rechter overschrijdingskans in %
Normaliteit controleren
- Omdat de dataverdeling bepaalt welke centrummaat een goede afspiegeling geeft van de
data en het bepaalt de statistische methode die je het beste kan gebruiken. Veel statistische
toetsen vereisen dat de data normaal verdeeld is.
- Normaal verdeling symmetrisch: gemiddelde = mediaan = modus
- Scheve verdeling is niet symmetrisch: gemiddelde > mediaan > modus
- Moraal: gemiddelde zegt niets als je geen beeld hebt van de verdeling
- Binnen 1 SD: 68% van alle waarnemingen
- Binnen 1.96 SD: 95% van alle waarnemingen
- Binnen 3 SD: ~100% van alle waarnemingen
- opletten bij: >1 & <-1
Toetsende statistiek
- Populatieparameters zijn bij steekproefonderzoek meestal onbekend
- Steekproefdata verzamelen we en de kengetallen zijn dus bekend
- andere steekproef = ander steekproefresultaat, waarde van de statistic wordt bepaald door
de populatie en door toeval.