Statistiek I
Introductie statistiek voor forensisch onderzoek
1. FORENSISCHE STATISTIEK..............................................................................................................2
1.1 STATISTIEK IN HET ALGEMEEN.............................................................................................................2
1.2 TYPEN DATA....................................................................................................................................2
1.3 WISKUNDE NOTATIE EN TERMINOLOGIE.................................................................................................2
1.4 CENTRUMMATEN.............................................................................................................................2
2. FREQUENTIEVERDELING................................................................................................................3
3. SPREIDING.....................................................................................................................................3
4. NORMALE VERDELING...................................................................................................................4
5. NAUWKEURIGHEID EN BETROUWBAARHEID.................................................................................4
3.1 BETROUWBAARHEID.........................................................................................................................5
3.2 NAUWKEURIGHEID............................................................................................................................5
6. CORRELATIE EN REGRESSIE............................................................................................................5
6.1 CORRELATIE....................................................................................................................................5
6.2 REGRESSIE......................................................................................................................................6
7. T-VERDELING.................................................................................................................................6
7.1 TOETSEN STAPPENPLAN.....................................................................................................................6
7.2 T-TOETS SIGNIFICANT VERSCHIL TUSSEN EN............................................................................................7
7.3 GEPAARDE T-TOETS..........................................................................................................................7
7.4 NIET-GEPAARDE T-TOETS....................................................................................................................8
7.5 CHI-KWADRAAT TOETS.......................................................................................................................8
8. SENSITIVITEIT EN SPECIFICITEIT.....................................................................................................8
9. ALLE FORMULES...........................................................................................................................10
9.1 FORMULEBLAD...............................................................................................................................12
11. APPENDIX..................................................................................................................................13
Desirée van Tuin | Hogeschool van Amsterdam | Forensisch Onderzoek | Jaar 1 | STT 1.2
, 1. Forensische statistiek
Statistische methodes die forensisch worden toegepast zijn:
- Regressie en kalibratie – regressie is het vinden van de relatie tussen het ene en het
andere en kalibratie is een schatting maken van de ene hoeveelheid van een andere.
- Percentages en opsommingen (samenvattende statistiek)
- Gemiddeldes, standaarddeviatie en t-toetsen
- Classificaties – categorieën toewijzen
- Andere methoden – Chi-kwadraat en Bayesiaanse methode
1.1 Statistiek in het algemeen
Er zijn twee soorten waarschijnlijkheden:
1. Kansen; zoals de resultaten van het gooien van dobbelstenen of het tossen met
munten.
2. Epistemisch (logica); door observatie kennis van een systeem krijgen en de
waarschijnlijkheden daarin. Bijvoorbeeld 60% van de populatie heeft een
smartphone; maar niet alle mensen van de populatie is ondervraagd dus er blijft een
onzekerheid (=generalisatie). Epistemische statistiek is veel nuttiger in de forensische
statistiek.
Statistiek is grofweg te verdelen in beschrijvende en analyserende statistiek. Beschrijvende
statistiek is data presenteren (grafiek, tabel, samenvatting in de vorm van een getal) met als
doel ‘inzicht’, wat stellen de getallen voor? Analyserende statistiek is het stellen van ‘vragen’
aan je data, om hierop een antwoord te krijgen die leidt naar vervolgacties (= toetsen).
1.2 Typen data
Er zijn drie fundamentele soorten data:
1. Nominale gegevens worden ingedeeld in afzonderlijke categorieën, waarbij de
volgorde geen betekenis heeft (geslacht = man/vrouw/anders).
2. Gewone gegevens worden ingedeeld in afzonderlijke categorieën, waarbij de
volgorde wél een betekenis heeft (ordenen op leeftijd).
3. Continue gegevens kunne elke waarde binnen een toegestaan bereik aannemen;
magnesium in glas is tussen de 0% en de 5%, maar ergens daartussen kan de
dáádwerkelijke waarde liggen.
Een aantal dingen die je moet weten zijn:
Nominale en gewone gegevens worden discreet genoemd, omdat ze in discrete
categorieën geplaatst kunnen worden.
Alle typen data heten variabelen.
Er zijn nominale en gewone (soms continue) variabelen die worden gebruikt om
andere variabelen te classificeren, dit worden factoren genoemd.
1.3 Wiskunde notatie en terminologie
x is een waarde die gemeten is;
n is het aantal waarden x ;
n
∑ x i is de sommatie van alle elementen van x i tot x n;
i=1
Het × of ⋅ teken (keer-teken) wordt vaak niet genoteerd.
1.4 Centrummaten
Gegevens kun je samenvatten door een centrummaat te geven. Er zijn drie standaard
centrummaten:
n
1. Gemiddelde:
∑ xi is gevoelig voor uitschieters en geeft geen informatie
x́= i=1
n
over de spreiding van je data.
Desirée van Tuin 2
Introductie statistiek voor forensisch onderzoek
1. FORENSISCHE STATISTIEK..............................................................................................................2
1.1 STATISTIEK IN HET ALGEMEEN.............................................................................................................2
1.2 TYPEN DATA....................................................................................................................................2
1.3 WISKUNDE NOTATIE EN TERMINOLOGIE.................................................................................................2
1.4 CENTRUMMATEN.............................................................................................................................2
2. FREQUENTIEVERDELING................................................................................................................3
3. SPREIDING.....................................................................................................................................3
4. NORMALE VERDELING...................................................................................................................4
5. NAUWKEURIGHEID EN BETROUWBAARHEID.................................................................................4
3.1 BETROUWBAARHEID.........................................................................................................................5
3.2 NAUWKEURIGHEID............................................................................................................................5
6. CORRELATIE EN REGRESSIE............................................................................................................5
6.1 CORRELATIE....................................................................................................................................5
6.2 REGRESSIE......................................................................................................................................6
7. T-VERDELING.................................................................................................................................6
7.1 TOETSEN STAPPENPLAN.....................................................................................................................6
7.2 T-TOETS SIGNIFICANT VERSCHIL TUSSEN EN............................................................................................7
7.3 GEPAARDE T-TOETS..........................................................................................................................7
7.4 NIET-GEPAARDE T-TOETS....................................................................................................................8
7.5 CHI-KWADRAAT TOETS.......................................................................................................................8
8. SENSITIVITEIT EN SPECIFICITEIT.....................................................................................................8
9. ALLE FORMULES...........................................................................................................................10
9.1 FORMULEBLAD...............................................................................................................................12
11. APPENDIX..................................................................................................................................13
Desirée van Tuin | Hogeschool van Amsterdam | Forensisch Onderzoek | Jaar 1 | STT 1.2
, 1. Forensische statistiek
Statistische methodes die forensisch worden toegepast zijn:
- Regressie en kalibratie – regressie is het vinden van de relatie tussen het ene en het
andere en kalibratie is een schatting maken van de ene hoeveelheid van een andere.
- Percentages en opsommingen (samenvattende statistiek)
- Gemiddeldes, standaarddeviatie en t-toetsen
- Classificaties – categorieën toewijzen
- Andere methoden – Chi-kwadraat en Bayesiaanse methode
1.1 Statistiek in het algemeen
Er zijn twee soorten waarschijnlijkheden:
1. Kansen; zoals de resultaten van het gooien van dobbelstenen of het tossen met
munten.
2. Epistemisch (logica); door observatie kennis van een systeem krijgen en de
waarschijnlijkheden daarin. Bijvoorbeeld 60% van de populatie heeft een
smartphone; maar niet alle mensen van de populatie is ondervraagd dus er blijft een
onzekerheid (=generalisatie). Epistemische statistiek is veel nuttiger in de forensische
statistiek.
Statistiek is grofweg te verdelen in beschrijvende en analyserende statistiek. Beschrijvende
statistiek is data presenteren (grafiek, tabel, samenvatting in de vorm van een getal) met als
doel ‘inzicht’, wat stellen de getallen voor? Analyserende statistiek is het stellen van ‘vragen’
aan je data, om hierop een antwoord te krijgen die leidt naar vervolgacties (= toetsen).
1.2 Typen data
Er zijn drie fundamentele soorten data:
1. Nominale gegevens worden ingedeeld in afzonderlijke categorieën, waarbij de
volgorde geen betekenis heeft (geslacht = man/vrouw/anders).
2. Gewone gegevens worden ingedeeld in afzonderlijke categorieën, waarbij de
volgorde wél een betekenis heeft (ordenen op leeftijd).
3. Continue gegevens kunne elke waarde binnen een toegestaan bereik aannemen;
magnesium in glas is tussen de 0% en de 5%, maar ergens daartussen kan de
dáádwerkelijke waarde liggen.
Een aantal dingen die je moet weten zijn:
Nominale en gewone gegevens worden discreet genoemd, omdat ze in discrete
categorieën geplaatst kunnen worden.
Alle typen data heten variabelen.
Er zijn nominale en gewone (soms continue) variabelen die worden gebruikt om
andere variabelen te classificeren, dit worden factoren genoemd.
1.3 Wiskunde notatie en terminologie
x is een waarde die gemeten is;
n is het aantal waarden x ;
n
∑ x i is de sommatie van alle elementen van x i tot x n;
i=1
Het × of ⋅ teken (keer-teken) wordt vaak niet genoteerd.
1.4 Centrummaten
Gegevens kun je samenvatten door een centrummaat te geven. Er zijn drie standaard
centrummaten:
n
1. Gemiddelde:
∑ xi is gevoelig voor uitschieters en geeft geen informatie
x́= i=1
n
over de spreiding van je data.
Desirée van Tuin 2