Belang van statistische geletterdheid → steeds meer data gedreven maatschappij
Misbruik van statistiek → wanneer men niet kritisch is, wordt data te snel geloof
Kansrekening gaat veelal uit van deductie: gegeven dat we alle details weten van een
bepaalde populatie, hoe waarschijnlijk is dan een bepaalde (steekproef-)uitkomst?
Algemeen → specifiek
Populatie → steekproef
Model → data
Statistiek gaat veelal uit van inductie: gegeven een (steekproef-)uitkomst, wat kunnen we
dan met welke waarschijnlijkheid zeggen over de populatie?
Specifiek → algemeen
Steekproef → populatie
Data → model
Overeenkomsten:
-kansrekening en statistiek houden beiden rekening met toeval (randomness)
-dezelfde technieken (bijv. gemiddelde) voor zowel steekproef als populatie
-statistiek maakt aannames over populatie (bijv. nulhypothese) om deze op basis van een
steekproef te kunnen weerleggen (falsificeren)
Statistiek is de wetenschap van het verzamelen, organiseren en interpreteren van
numerieke feiten, die gegevens of data worden genoemd
Beschrijvende statistiek: vat data over steekproef of populatie samen met
nummers,tabellen en grafieken
Inferentiële statistiek: Inferentiële statistieken doen voorspellingen over
populatieparameters, gebaseerd op data van de steekproef
Methodologie: Systematische wijze van hoe je (empirisch) onderzoek zou moeten uitvoeren.
Statistiek: Het instrumentarium om empirisch onderzoek uit te kunnen voeren
Vaak zijn methodologie en statistiek wel degelijk verschillend, maar kunnen in goed
empirisch niet onderzoek zonder elkaar.
Onderzoeken met behulp van data: observaties van karakteristieken
-populatie: de totale set van deelnemers, relevant voor onderzoeksvraag (vb
populatiegrootheid (parameter): gemiddeld aantal uren zelfstudie per week)
-steekproef: een deel van de populatie waarover data verzameld is (vb steekproefgrootheid
(statistic): gemiddeld aantal uren zelfstudie per week
Goede data nodig om deze onderzoeksvraag te beantwoorden:
-betrouwbaar (reliable)
-valide (valid)
Variabele: gemeten karakteristiek die kan verschillen tussen subjecten
Soorten: gedrag-, stimulus-, subject-, fysiologische-variabelen.
Meetniveau's:
Categorisch/kwalitatief
→ nominaal (bijv. oogkleur)
,→ ordinaal (bijv. opleiding niveau)
Kwantitatief/numeriek
→ interval (bijv. graden celcius)
→ ratio (bijv. kelvin)
Waardebereik:
-discreet (discrete) → eindig ondeelbare meeteenheid (aantal broers/zussen)
-continu (continuous) → oneindig deelbare meeteenheid (bijv. lichaamslengte)
Steekproef problemen bij inferentiële statistiek
Doel: betrouwbare en valide uitspraken over populatie obv een steekproef
→ Steekproefgrootheden dienen dan niet te verschillen van populatiegrootheden
Problemen:
● Steekproef fout (sampling error) → “toevallige steekproefverschillen”
● Steekproefvertekening (sampling bias) → “selectieve werving”
● Meetfout (response bias) → “incorrect antwoord”
● Selectieve response (non-response bias) → “selectieve deelname”
Betrouwbaarheid → error
Validiteit → bias
, Lecture 2 (week 1)
Inferentiële statistiek → op basis van een steekproef uitspraken doen over gehele
(doel-)populatie.
Verschil tussen gemeten steekproefgrootheid en populatiegrootheid:
-Door natuurlijke variatie (toeval) tussen steekproeven
-Door problemen/fouten met/binnen de steekproef
Oplossing steekproef fout: een aselecte (of andere van voldoende aanleiding die informatie
(data) winst over iedereen die is, met correcte reacties voor alle onderwerpen op alle items.”
Steekproeftrekken:
1. Enkelvoudige aselecte toepassingen (simple random sampling)
2. Systematisch aselecte activiteiten (systematic random sampling)
3. Gestratificeerde bevoegdheid (stratified random sampling)
4. Clusterbemonstering (cluster sampling)
5. Getrapte bemonstering (multi-stage sampling)
Enkelvoudige aselecte steekproef (simple random sampling)
Kenmerken:
- Elke combinatie van deelnemers heeft evenveel kans om steekproef te vormen.
- Haalbaar als participanten vanuit gehele doelpopulatie benaderbaar zijn.
- Vereist groot aantal willekeurige getallen om steekproef te bepalen.
Stap 1: stel steekproefkader vast (sampling frame)
Bijv: een lijst met alle studentnamen uit de studentadministratie
Stap 2: trek willekeurig/aselect steekproef van n deelnemers
Bijv: nummer toewijzen aan iedere student en dan met n willekeurige getallen studenten
kiezen voor steekproef
Systematisch aselecte activiteiten (systematic random sampling)
Kenmerken:
- Niet van deelnemers heeft gelijke kans om elke combinatie de vormen
- Eenvoudig om uit te voeren en vaak goede representativiteit
Stap 1: stel steekproefkader vast (sample framing)
Stap 2: bepaal stapgrootte k=N/n “skip numbers”
Bijv: uitbreiding n=4, pop N=20, k=20/4=5
Stap 3: kies eerste deelnemer aselect en bepaal vervolgens deelnemers met deze
stapgrootte k:
Bijv: voor eerste student willekeurig nummer bepalen (bv. 3) en dan
elke ke student omvat.
Gestratificeerde steekproef (stratified random sampling)
Kenmerken:
-Op voorafgaande groepen die aan elkaar worden voldaan
-Binnen iedere groep (stratum) wordt communicatie
-Kan proportioneel of disproportioneel