Hoorcollege 1
Soorten statistiek
1. Beschrijvende statistiek: een kenmerk (‘variabele’) van een groep (‘steekproef’) van
onderzoekseenheden beschrijven.
2. Verklarende statistiek: verbanden (‘samenhang’) tussen twee of meer kenmerken van
onderzoekseenheden.
-> niet één ding, maar twee dingen gemeten: samenhang of niet? (bivariate analyse)
-> bij meer dan twee variabelen multivariate analyse (niet in dit vak)
3. Inferentiële statistiek: generaliserende uitspraken doen over populaties op basis van een
steekproef.
-> uitspraken doen die met een zekere mate van zekerheid waar zijn voor de bredere
populatie.
Kennisclip 1: Centrale tendentie
- Centrale tendentie is één van de drie aspecten van de beschrijvende statistiek.
- ‘Hoe ziet een typische observatie in de steekproef eruit?’
- Drie statistische maten voor de centrale tendentie: de modus, de mediaan en het
gemiddelde.
- Modus: meest voorkomende score (waarde) van een bepaald kenmerk (variabele) in de
steekproef.
-> er kunnen twee modi zijn.
- Mediaan: de middelste score (waarde) van een bepaald kenmerk (variabele) in de
steekproef.
-> op volgorde zetten; bij een even getal is de mediaan het gemiddelde van de twee
middelste.
- Als er een aanvullend persoon bij de steekproef komt heeft dit gevolgen voor de modus
(wellicht nog een modus), de mediaan en het gemiddelde.
- Het (rekenkundig) gemiddelde: de som van alle individuele waarden, gedeeld door het
aantal.
Meetniveaus
1. Nominaal meetniveau
-> wel te onderscheiden, niet mogelijk om te ordenen.
-> alleen de modus is te onderscheiden (welke komt het meeste voor?)
2. Ordinaal meetniveau
-> in staat om waarden te onderscheiden, maar ook in volgorde zetten.
-> bv. de Likert schaal.
-> de modus en de mediaan zijn aan te wijzen.
-> beperking: geen zekerheid dat de stappen tussen de waarden even groot zullen zijn.
3. Interval-ratio meetniveau
-> onderscheid te maken tussen waardes, deze zijn te ordenen en de stappen tussen de
waarden zijn gelijk.
-> de modus, de mediaan en het gemiddelde zijn te onderscheiden.
,Kennisclip 2: Spreiding
- Spreiding is ook één van de drie aspecten van de beschrijvende statistiek.
-> in hoeverre bestaan er verschillen tussen de verschillende observaties in de steekproef?
- Verschillende manieren om spreiding te rapporteren.
- Frequentie: hoe vaak komen scores voor in de steekproef?
-> presenteren in een frequentietabel en vermelden wat de frequentie is per score.
-> met een grote steekproef met veel scores individuele scores clusteren in categorieën.
- Bereik: hoogste score min de laagste score (R)
- Variantie en standaarddeviatie: mate van variëteit ten opzichte van het gemiddelde van de
steekproef eerst het gemiddelde nemen.
- Variantie:
- Standaarddeviatie:
-> wortel van de variantie.
-> weer uitgedrukt in de eenheid van de observaties, terwijl variantie een obscuur getal is.
-> brengt door de wortel het antwoord terug in de originele eenheid of grootheid.
Meetniveaus
- Welke manier je gebruikt om spreiding te rapporteren hangt af van het meetniveau.
1. Nominaal meetniveau
-> frequentie
-> er is namelijk niet te rekenen met het nominale meetniveau.
2. Ordinaal meetniveau
-> frequentie en bereik
-> omdat er mogelijkheid is van ordening, ook bereik mogelijk
3. Interval-ratio meetniveau
-> frequentie, bereik, variantie en standaarddeviatie.
-> aangezien we in staat zijn om te rekenen (in het bijzonder het gemiddelde)
Kennisclip 3: Vorm (normaalverdeling)
- De vorm is een laatste aspect van de beschrijvende statistiek.
-> in hoeverre voldoet de verdeling aan de kenmerken van de normaalverdeling?
- Manier om de vorm te bekijken is door een histogram te maken.
-> visualisering van een frequentietabel
- Theoretisch idee over hoe verdelingen van variabelen op interval-ratio niveau er vaak
uitzien, mits de steekproef groot genoeg is.
- Kenmerken van de normaalverdeling:
-> gemiddelde = mediaan = modus (drie maten van centrale tendentie) bijzondere vorm.
-> bell-shape of ‘klokvorm’ (perfecte vorm van verdeling)
-> uni modaal (1 piek)
-> symmetrisch (niet ‘scheef’, unskewed)
-> oneindigheid
- In werkelijkheid heeft een verdeling een zekere mate van scheefheid en voldoet het niet
helemaal aan de karakteristieken van de normaalverdeling.
, Scheefheid
- Positieve scheefheid:
-> extreme hoge waarden trekken het gemiddelde omhoog (naar rechts)
-> gemiddelde > mediaan
- Negatieve scheefheid:
-> extreme lage waarden trekken het gemiddelde omlaag (naar links)
-> gemiddelde < mediaan
Standaarddeviatie en gemiddelde
- Vanwege de specifieke (theoretische) kenmerken van de normaalverdeling, kun je op basis
van twee statistieken van alles te weten komen over een verdeling.
-> door het gemiddelde (centrale tendentie) en de standaarddeviatie (spreiding)
- In een normaalverdeling kan de standaarddeviatie gebruikt worden om te concluderen waar
zich welk percentage van de observaties bevindt.
- Binnen 1 standaardafwijking links en rechts van het gemiddelde bevindt zich 68,26% van de
observaties (68% afgerond)
- Binnen 2 standaardafwijkingen bevindt zich 95,44% van de observaties (95% afgerond)
- Binnen 3 standaardafwijkingen bevinden zich 99,72% van de observaties (99% afgerond,
door oneindigheid)