Blok 5 Beschrijvende Statistiek
Kwalitatief categoriaal
Kwantitatief numeriek
Discreet: kan maar 1 bepaalde waarde aannemen zoals hoeveel zussen heb je
Continu: eenheden die elke waarde kunnen aannemen zoals lengte
Vraag 1: Welk van onderstaande variabelen is een discrete variabele?
A
B
C
D
Meetschalen:
Nominaal gebruiken labels om data te classificeren in verschillende categorieën,
Ordinaal kwalitatief onderzoek dus geen berekeningen (nominaal zwakste)
Interval gebruiken numerieke waarden om de grootte van een waarneming te kwantificeren,
Ratio kwalitatief onderzoek dus voor analyses met berekeningen (ratio sterkste)
Nominale schaal = categoriseren van metingen, categorieën zijn niet gerelateerd en tonen tov
elkaar alleen een verschil aan en geen verband dus = en ≠
Ordinale schaal = gerangschikt in orde, dus verschil en richting van verschil kun je aantonen,
dus = ≠ en > <
Interval schaal = de waarden zijn bekend en even groot, er is geen nulpunt (dus kan ook in de min
gaan), kunt optellen en aftrekken, verschil en richting van verschil en grootte van verschil aantonen,
dus = ≠ en > < en + -
Ratio schaal = zelfde als intervalschaal, maar heeft wél absoluut nulpunt waarbij 0 dus betekent
volledige afwezigheid van gemeten variabele, kunt verschil – richting van verschil – grootte van
verschil – ratio berekenen aantonen, dus = ≠ en > < en + - en x /
Vraag 2: Welk van de onderstaande variabelen is gemeten op een intervalschaal?
A
B
C
D
,Vraag 3: Met een intervalschaal, kan men (meerdere antwoorden mogelijk):
A
B
C
D
Frequentieverdeling = sorteren van waarnemingen laag hoog en groepeert zelfde waardes, tabel
of grafiek bestaat uit categorieën/waarden vd meetschaal en frequentie vd waarnemingen in elke
groep. Ook kan locatie van specifieke waarneming in dataset te beschrijven. 3 eigenschappen:
- centraliteit = wat een typische gemiddelde is
- variabiliteit = zijn waarden dicht bij elkaar of verspreid
- vorm = ligt data symmetrisch of scheef
Vb. Vb.
Frequentieverdeling weergegeven in grafiek:
1 Staafdiagram: voor frequenties van kwalitatieve gegevens (categorieën)
2 Histogram: voor frequenties van kwantitatieve waarnemingen (numeriek)
3 Frequentiepolygonen: lijndiagram voor cumulatieve frequentieverdeling
Vraag 4: Hoeveel steden
stoten minder dan 2,5
mg / m3 koolmonoxide
(CO) uit?
, Symmetrische verdeling = links en rechts spiegel
Uniforme verdeling = als links rechts exact zelfde frequenties zijn
Scheve verdeling = links rechts ongelijke frequenties
Rechts-scheef: staart rechts, piek links
Links-scheef: staart links, piek rechts
Vraag 5: Bepaal de vorm van de volgende grafiek:
A
B
C
Vraag 6: Huizenprijzen hebben een:
A
B
Vraag 7: Menselijke leeftijdsverwachting heeft een:
A
B
Locatie van een score bepalen door berekenen van de percentiel rang = percentage vd scores in de
verdeling met een waarde =< de score waar het om gaat. De score wordt dan een percentiel (P)
genoemd, percentielen zijn waarden die een verdeling in 100 gelijke delen verdelen.
aantal waardes=¿ aan waarde X =… die je wil weten
Berekenen: Percentiel rang= ×100 %
totaal aantal waardesdie er zijn
zoveelste perctiel dat jemoet berekenen
Berekenen: Percentiel= × ( totaal n−1 ) +1
100
Bij verdeling van scores in gelijke delen worden de delende waarden kwantielen (k) genoemd. Als
we een dataset in k gelijke delen opsplitsen, dan noemen we de delende waarden k-kwantielen.
Ongeacht de gekozen waarde van k, zijn er altijd k−1 kwantielen.
Als je een verdeling in 4 gelijke delen opsplitst, dan heet elk deel een kwartiel met Q1
(= 25e percentiel) Q2 (= 50e percentiel AKA mediaan) Q3 (= 75e percentiel)
zoveelste kwartiel wat je wil berekenen
Berekenen: Kwartiel= × ( toaal n−1 ) +1
4
Centrummaat = waarde die centrum van een verdeling beschrijft, geeft vaak gem. score weer
Modus: meest frequentie van een score/categorie, is de piek in een frequentiegrafiek,
kan worden berekend bij nominaal-ordinaal-interval-ratio, als verdeling 2 modi heeft is het
bimodale (zelfde frequentie), meerdere modi is multimodale, of verdeling zonder modus