Week 1 ............................................................................................................................................................. 2
Waar zijn wij mee bezig? ................................................................................................................................... 2
Variabelen in beeld ............................................................................................................................................ 3
Verdelingen – centrum en spreiding ................................................................................................................. 4
Populaties en steekproeven ............................................................................................................................... 6
Week 2 ............................................................................................................................................................. 7
Normale verdeling ............................................................................................................................................. 7
Twee variabelen in beeld ................................................................................................................................... 9
Week 3 ........................................................................................................................................................... 10
Correlatie ......................................................................................................................................................... 10
Lineaire regressie deel 1 .................................................................................................................................. 11
Lineaire regressie deel 2 .................................................................................................................................. 13
Week 4 ........................................................................................................................................................... 15
Lineaire regressie – residuen .......................................................................................................................... 15
Lineaire regressie – r2 ..................................................................................................................................... 17
Causaliteit ........................................................................................................................................................ 18
Steekproeven .................................................................................................................................................... 19
Week 5 ........................................................................................................................................................... 22
Centrale limietstelling ..................................................................................................................................... 22
Hypothesen toetsen .......................................................................................................................................... 23
Hypothese toetsen: 4 stappen .......................................................................................................................... 24
T-toets .............................................................................................................................................................. 26
Z-toets .............................................................................................................................................................. 29
Week 6 ........................................................................................................................................................... 30
Paired-samples T-toets .................................................................................................................................... 30
Correlatie toetsen ............................................................................................................................................. 32
Onderscheidingsvermogen .............................................................................................................................. 33
Betrouwbaarheidsintervallen .......................................................................................................................... 35
,Week 1
In het Reids Open Acces boek staat het theoriedeel van het vak.
https://digitalcommons.buffalostate.edu/oer/1/
Waar zijn wij mee bezig?
Criminologische vragen worden opgelost door middel van empirisch onderzoek. Er wordt een
vraag gesteld, waarbij een hypothese kan worden opgesteld. Daarna wordt bepaald hoe je gaat
onderzoeken en of deze hypothese klopt klopt, hierbij verzamel je gegevens en doe je analyses.
Als laatste verklaar je de resultaten en trek je de conclusie. We verzamelen, beschrijven en
analyseren data om vragen te beantwoorden.
Twee mogelijkheden om data te analyseren
• Beschrijvende (descriptieve) statistiek
o Hoeveel criminaliteit was er in 2019?
• Inductieve (beslissende, inferentiële) statistiek
o Worden ex-gevangenen minder vaak aangenomen?
Elementen (populatie)
• Personen, bedrijven, landen, wijken, scholen
Variabelen (geven informatie over elementen)
• Kenmerken, overlast
• Kwalitatief versus Kwantitatief
• Kwalitatief
o Elementen in twee of meer categorieën plaatsen
o Nominaal (geen volgorde tussen waarden)
o Ordinaal (natuurlijke ordening)
▪ Bij schalen mag je er kwantitatief mee rekenen (interval)
• Kwantitatief
o Numerieke waarden (aantallen)
o Interval (continu – heeft geen nulpunt)
o Ratio (discreet – natuurlijke nulpunt aanwezig)
Hoe ziet ‘data’ eruit?
• Elementen/subjects scoren op variabelen
• Coderen van data
• Let op:
o Missing waardes ook coderen (bijv. 999)
o SPSS – data matrix (scores in cellen)
▪ Rijen = subjects (elementen
▪ Kolommen = variabelen
2
,Variabelen in beeld
Variabelen
• Kwalitatief
o Nominaal (niet gerangschikt)
o Ordinaal (gerangschikt)
• Kwantitatief
o Interval (geen nulpunt, denk aan temperatuur)
o Ratio (nulpunt, denk aan toetscijfer)
Variabelen en Experimenten
• Twee of meer groepen met verschillende ‘behandeling’
• Meet en vergelijk uitkomsten van de groepen
• Onafhankelijke variabelen versus Afhankelijke variabelen
o Onafhankelijke variabelen: bijvoorbeeld behandeling
o Afhankelijke variabelen: bijvoorbeeld recidive
o Afhankelijke variabele is afhankelijk van onafhankelijke variabele
Grafieken: exploratieve analyse
• Belangrijke eerste stap
o Breng variabelen in beeld
o Snelle manier om bijzonderheden te zien
o Maar kies de juiste grafiek
Kwantitatieve variabelen
• Groeperen in klasse-intervallen
• Overzichtelijker maar informatie verlies
• Stamdiagram: overzichtelijk, geen informatie verlies
3
,Verdelingen – centrum en spreiding
Verdelingen
• Vorm van een verdeling
o In beeld met histogram
• Centrum en spreiding van een verdeling
o Beschrijven met et cijfers
Centrum
Centrale tendentiematen
• Modus
o Zinvol bij nominale variabelen
• Mediaan
o Zinvol bij ordinale en kwantitatieve variabelen
o Niet gevoelig voor uitbijters of scheve verdelingen – resistent
• Gemiddelde (mean)
o Statistisch sterk maar gevoelig voor uitbijters – niet resistent
Vorm en centrum:
• Positief scheef (rechtsscheef)
o Mediaan en gemiddelde liggen rechts van de modus (vallen niet samen).
• Symmetrisch (normale verdeling)
o Modus, mediaan en gemiddelde vallen samen.
• Negatief scheef (linksscheef)
o Mediaan en gemiddelde liggen links van modus (vallen niet samen).
Mediaan en kwartielen
• Mediaan
o Precies 50e percentiel
• Kwartielen – Q1 en Q3
o 25e en 75e percentielen
o Kwartielen worden gebruikt om aan te geven hoe verspreid een verdeling is.
▪ Liggen ze ver uit elkaar, is je verdeling verspreid.
▪ Liggen ze dicht op elkaar, is je verdeling niet verspreid.
Percentielen: berekenen
• ll = lower limit = exacte ondergrens van het
interval (de klasse) waar het percentiel punt invalt
• n = het totaal aantal scores
• p = proportie die correspondeert met het gewenste percentiel
• cf = cumulatieve frequentie van de scores onder het interval (de klasse) waar het
percentielpunt invalt
• fi = frequentie van de scores in het interval (aantal mensen in de klasse) waar het
percentielpunt invalt.
• w = width= de breedste van het interval (klasse)
4
, Boxplot: 5 getallen samenvatting
• Min
• Q1
• Mediaan
• Q3
• Max
• (Uitschieters)
Interkwartielafstand (IKA)
• IKA = Q3 – Q1
• Criterium voor uitschieters
o IKA x 1,5
• Reasonable Lower Boundary
o RLB = Q1 - 1.5(IKA)
• Reasonable Upper Boundary
o RUB = Q3 + 1.5(IKA)
• Als de variabele onder de RLB ligt of boven de RUB, is het een uitschieter
Het (rekenkundige) gemiddelde
• Populatiegemiddelde (parameter, warden die gehele populatie beschrijven)
• Steekproefgemiddelde (statistiek of grootheid)
• Dichotome variabelen (0 of 1) – gemiddelde gelijk aan proportie score 1
o Dichotome variabelen = nominale variabelen met twee categorieën
• Som van de afwijkingen van gemiddelde = 0
• Het gemiddelde is niet resistent (uitschieter heeft groot effect op gemiddelde)
Variantie
• Gebruik samen met gemiddelde (om verdeling te beschrijven)
• Verschillende formules mogelijk
• s2 = steekproefgrootheid / s2 (sigma) = populatieparameter
Standaarddeviatie
• Ook standaardafwijking genoemd
• Wortel van de variantie -> vergelijkbaar met variabelen waarden
• Verschillende formules mogelijk
• s = steekproefgrootheid (sigma) =
populatieparameter)
• Hoe kleiner de variantie, hoe minder
de verdeling is verspreid
• Hoe groter de variantie, hoe meer de
verdeling is verspreid
• Niet resistent – uitschieter heeft grote invloed
Welke maten?
• Kijk eerst naar vorm van de verdeling (histogram)
• Scheve verdeling/uitschieters -> vijf-getallen-samenvatting
• Redelijk normaal verdeeld, zonder uitschieters -> x̅, s2 en s
5