Empirische opdracht: Eigen data verkennen
Universiteit van Amsterdam
Module Beschrijvende Statistiek
-Naam- (-Studentnummer-)
Werkgroep 4
Docent: -Naam docent-
Aantal woorden: 642
Datum: 03 december 2017
1
, EIGEN DATA VERKENNEN
1) De gekozen variabelen zijn: leeftijd, studie, basisschool.
a) De variabele ‘leeftijd’ is een kwantitatieve variabele. Dit is een kwantitatieve variabele, omdat
de verschillende waarden worden uitgedrukt in getallen en deze getallen zijn niet enkel een label,
zoals bij bijvoorbeeld een variabele zoals ‘respondentnummer’ het geval zou zijn. De variabele
zou beschouwd kunnen worden als een continue variabele, omdat de variabele in principe iedere
mogelijke waarde aan zou kunnen nemen. In dit geval is de variabele echter discreet, omdat de
waarden enkel worden uitgedrukt in hele jaren. De variabelen ‘studie’ en ‘basisschool’ zijn
beiden categorisch en discreet. De waarden worden namelijk niet uitgedrukt in getallen en de
variabele kan slechts een beperkt aantal waarden aannemen. De variabele ‘basisschool’ is
gemeten door middel van een Likert-schaal. Wanneer een variabele door middel van
verschillende items met een Likert-schaal wordt gemeten, kan deze behandeld worden als
kwantitatief. In dit geval is er slechts één item die de variabele meet en behandelen we deze als Figuur 1: Boxplo
'leefijd'
categorisch.
b) Leeftijd – Betekenisvolle statistics zijn hier de gemiddelde leeftijd (19,86), de mediaan
(19,00) en de modus (18). De range is 25, met een minimum van 16, een maximum van 41 en
een standaarddeviatie van 2,767. Om potentiële outliers te bepalen, is een boxplot gemaakt. Voor
deze beschrijvende statistiek is gekozen, omdat SPSS outliers duidelijk aangeeft door middel van
een sterretje. Uit de boxplot (figuur 1) blijkt dat er sprake is van één potentiële outlier. Deze
observatie valt meer dan 1,5 x IQR boven het derde kwartiel. Te zien is dat het om respondent
103 gaat, die een leeftijd heeft van 41 jaar.
Studie – De modale categorie van de steekproef is ‘pedagogiek’ met 45%. Omdat deze variabele
een nominaal meetniveau heeft, hebben het gemiddelde en de
mediaan geen zinvolle betekenis.
Basisschool – De modale categorie van de steekproef is ‘mee
oneens’ met 38,1%. Omdat deze variabele een ordinaal
meetniveau heeft, hebben de categorieën een bepaalde
volgorde, maar zijn de verschillen hiertussen niet
interpreteerbaar. Daarom hebben het gemiddelde en de
mediaan geen zinvolle betekenis.
2) De twee variabelen waarvan de relatie wordt onderzocht, Figuur 2: Scatterplot
'leefijd' & 'reiskm'
zijn ‘leeftijd’ en ‘reiskm’. Door middel van toetsende statistiek wordt onderzocht of er
2