Samenvatting hoorcolleges
Week 1 & Week 2
Beschrijvende en inferentiële statistiek
, Week 1
Module 0.1 – Introductie
Wat is statistiek?
Statistiek = het verzamelen en analyseren van gegevens.
Gegevens → data.
Dataset = veel gegevens bij elkaar.
Twee soorten statistiek
1. Beschrijvende statistiek: het beschrijven (samenvatten) van de verkregen data.
Hoe zien de data eruit?
2. Inferentiële statistiek: uitspraken doen over de hele populatie op basis van een
steekproef. (To infer = concluderen.)
Module 0.2 – Statistische concepten
Variabelen = kenmerken van iemand of iets.
Constante = geen variabele, maar een kenmerk dat hetzelfde is bij elke case.
Cases = die ‘iemand of iets’ waarover je gegevens verzamelt.
Alle kenmerken van een case kunnen variabelen zijn, maar ze moeten wel variëren —
anders is het een constante.
Voorbeeld
Je bestudeert verschillende voetbalclubs in Spanje:
• Stad waar de club bij hoort (Barcelona, Madrid, Valencia, …) → variabele, want hij
varieert.
• Land waarin de club speelt (Spanje voor allemaal) → constante, want geen variatie.
Meetniveaus
Door het grote aantal variabelen is het belangrijk onderscheid te maken tussen
meetniveaus:
Meetniveau Kenmerken Voorbeeld
Nominaal Categoriale variabele; verschillende categorieën Geslacht, land
zonder rangorde. Je kunt niet zeggen dat de één
‘beter’ is dan de ander.
Ordinaal Categoriale variabele met rangorde. Verschil tussen Opleidingsniveau
categorieën is niet bekend.
Interval Rangorde én vergelijkbare (gelijke) intervallen Temperatuur in