Univariate beschrijvende statistiek
“Een concept dat we gemeten hebben, gaan we beschrijven”
M1: Statistische begrippen
• Casus = persoon, land, jaar etc.
• Variabele = alles wat kan variëren
• Constante = alles wat niet varieert
Meetniveaus
• Categorisch / kwalitatief
o Nominaal (naam, dag van de week)
§ Iets dat een naam heeft
§ Niet te kwantificeren
o Ordinaal (likert-schalen)
§ Nominale variabelen, die een volgorde hebben
§ Soms als kwantitatief behandeld
• Kwantitatief
o Interval (temperatuur, IQ)
§ Nul is arbitrair
§ Niet te vermenigvuldigen of daaraan te vergelijken
o Ratio (lengte, gewicht)
§ Nul is betekenisvol
§ Vergelijken mag
M2.2: Centrummaten
• Modus = meest voorkomende waarde
• Mediaan = middelste waarde
• Gemiddelde (mean) = alle waarden bij elkaar opgeteld / aantal casussen
o Wordt sterk beïnvloed door de ‘staart’ (tail) van een verdeling
Negatively skewed Normaal Positively skewed
Linksscheef Rechtsscheef
Skewed to the left Skewed to the right
VU Amsterdam | Premaster Bestuurskunde | Beschrijvende en Inferentiële Statistiek
,Spreidingsmaten
Standaardafwijking / standaarddeviatie
“De standaardafwijking laat zien hoeveel gegevens gemiddeld afwijken van het gemiddelde”
Stap 1
• Controleren hoeveel elke observatie (geval) afwijkt van het gemiddelde
• x = observatie
• 𝑥̄ = gemiddelde
• Deviatie:
Stap 2
• We gebruiken de deviaties om tot de standaardafwijking te komen
• De gemiddelde afstand tot het gemiddelde
o Deviatie
o Deviatie wordt gekwadrateerd = (x – 𝑥̄)2
o Alle gekwadrateerde deviaties worden opgeteld = SUM(x – 𝑥̄)2
o De uitkomt wordt gedeeld door (aantal waarnemingen – 1)
o s = wortel van het resultaat van deze deling
Spreiding en standaardafwijking
• Standaardafwijking zegt iets over de spreiding in gegevens
• Hoe groter de standaardafwijking, hoe groter de spreiding in de gegevens
o Bij grote spreiding, minder zekerheid over de gegevens
o Bij kleine spreiding, consistente antwoorden
Empirische regel
VU Amsterdam | Premaster Bestuurskunde | Beschrijvende en Inferentiële Statistiek
, Meer beschrijvende univariate statistiek (z-score)
Z-score
“Hoeveel standaardafwijkingen een bepaalde observatie van het gemiddelde is”
• Met andere woorden: het zegt iets over hoe ongewoon een waarneming is op een
gestandaardiseerde schaal
• Dit betekent dat je gegevens kunt vergelijken die op een andere schaal worden
gemeten
• Positieve z-score = hoger dan gemiddeld
• Negatieve z-score = lager dan gemiddeld
Bivariate beschrijvende statistiek
M3.1: Verbanden tussen variabelen
• Scatterplots: visualiseren het verband tussen twee kwantitatieve variabelen
o Eén variabele staat op horizontale x-as (bijv. leeftijd)
o Andere variabele staat op verticale y-as (bijv. inkomen)
o Verband tussen x (leeftijd) en y (inkomen)
• x-as = altijd onafhankelijke variabele (independent)
o Niet afhankelijk van iets anders
o “Het is zo”
• y-as = altijd afhankelijke variabele (dependent)
o Hangt af van iets anders
Lineaire en niet-lineaire verbanden
• Positief verband: als y ook zal toenemen, wanneer x toeneemt
• Negatief verband: wanneer y zal afnemen, wanneer x toeneemt
• Niet lineair verband: verband tussen x en y kan niet worden beschreven in termen
van een rechte lijn à niet constant
• Géén verband: verandering in x is niet geassocieerd met verandering in y
Correlatie
• Sterkte van een lineair verband tussen kwantitatieve
variabelen
• Correlatie wordt uitgedrukt in correlatiecoëfficiënt = r
• r is schaalonafhankelijk, dus ook bij standaardiseren
blijft correlatie hetzelfde
• r ligt altijd tussen -1 en +1
o Hoe dichter r bij 0 ligt, hoe zwakker het verband
o Hoe dichter r bij -1 of +1 ligt, hoe sterker het
verband
o Hoe sterker r is naar -1, hoe sterker de
negatieve correlatie
§ Als X stijgt, daalt Y
o Hoe sterker r is tot +1, hoe sterker de positieve
correlatie
§ Als X stijgt, stijgt Y
VU Amsterdam | Premaster Bestuurskunde | Beschrijvende en Inferentiële Statistiek