College 1a:
Categorische variabele: een case behoort tot een van enkele verschillende groepen of categorieën.
Kwantitatieve variabele: neemt numerieke waardes aan waarbij uitkomsten van berekeningen zinvol te
interpreteren zijn.
Specifiekere indeling = meetniveau van variabelen
• Nominale schaal: wijst een waarneming toe aan ongeordende categorieën. (Geslacht, groep, politieke
partij) (categorisch)
• Ordinale schaal: wijst waarnemingen toe aan geordende categorieën. (Hoe goed ben jij in sport? Kies
uit: slecht, middelmatig, goed) (categorisch)
• Interval/ratio schaal: wijst scores toe op een schaal met kwantitatieve informatie.
• De uitkomsten van berekenen zijn zinvol te interpreteren.
• De score op een test is gemiddeld een 5,2.
• Absoluut nul punt.
• Kwantitatieve variabelen.
Algemeen: kies altijd het hoogst mogelijke meetniveau!
Discreet vs. continue:
• Discreet: getallen “ertussen” hebben geen betekenis (hoeveel broers
en zussen heb je?)
▪ Vaak normaal/ordinaal
• Continue: getallen “ertussen” hebben wel betekenis (hoe lang ben je?)
▪ Interval/ratio kan beide
Grafische weergave
• Shape/vorm
-outliers/uitbijters
• Centrum
- mediaan (verdeelt de data in 2 stukken van 50%)
- gemiddelde
- modus (welk getal komt het meest voor?)
• Spreiding
- range (max-min) (niet resistent voor outliers)
- standaarddeviatie (niet resistent voor outliers)
- variantie
- IQR (Q3-Q1) (wel resistent voor outliers)
Gemiddelde
• Niet resistent voor outliers
•
, College 1b:
IQR
• 4 gelijke delen van 25%
• 1e kwartiel (Q1): mediaan van de laagste 50%= dus 25%
• 2e kwartiel (Q2): mediaan= dus 50%
• 3e kwartiel (Q3): mediaan van de hoogste 50%= dus 75%
• IQR=Q3-Q1= middelste 50% van de data. Hoe kleiner hoe kleiner de afstand van de punten tot de
mediaan. (Wel resistent voor outliers).
Five number summary
• 1e getal= minimum
• 2e getal= Q1
• 3e getal= Q2/mediaan
• 4e getal= Q3
• 5e getal= maximum
• Boxplot (het blokje is 50%)
• Wel resistent voor outliers
Variantie s2
Hoe ver (gemiddeld) liggen de observaties van het gemiddelde af? (Wel gevoelig voor outliers)
Hoe te berekenen?
• Xi - 𝑥̅ voor elke observatie i
• Kwadrateer dat: (Xi - 𝑥̅ )2
• Delen door n-1:
Standaarddeviatie s
De variantie maar dan in de juiste eenheid van de data. (Wel gevoelig voor outliers)
Hoe te berekenen?
= √s2
Outliers & 1,5 x IQR regel
Een observatie die meer dan 1,5 x IQR valt
• Onder Q1 of
• Boven Q3 is vermoedelijk een outlier
• Een modified boxplot geeft de outliers apart weer van de boxplot (gebaseerd op de 1,5xIQR regel)
Lineaire transformaties
Om bijvoorbeeld van km naar Miles te gaan of euro naar dollar.
• a= constante plus (verplaatst de grafiek naar links of recht)
• b= constante keer (maakt de grafiek wijder)
• Nieuwe gemiddelde→
• Nieuwe standaarddeviatie→
• Veranderd de correlatie NIET