Inhoudsopgave
Week 1: Herhaling en T-toetsen ....................................................................................................................... 2
College 1: herhaling en t-toetsen........................................................................................................................ 2
Kennisclip 1-steekproef t-toets ......................................................................................................................... 11
Kennisclip: gepaarde t-toets ............................................................................................................................. 14
Kennisclip: 2-steekproef t-toets ........................................................................................................................ 17
Afsluiting week 1: ............................................................................................................................................. 21
Week 2: ANOVA & Lineaire Regressie ............................................................................................................. 22
College 2: ANOVA & Lineaire regressie ............................................................................................................. 22
Kennisclip Lineaire regressie ............................................................................................................................. 36
Week 3: CHI2 en logistische regressie ............................................................................................................. 40
College 3: Analyse van dichotome uitkomsten ................................................................................................. 40
Kennisclip: Logistische regressie ....................................................................................................................... 55
Week 4: Multipele regressies ......................................................................................................................... 61
College Multipele assocatiemodellen ............................................................................................................... 61
Kennisclip: multipele associatie modellen (confounding) ................................................................................. 74
Kennisclip: multipele associatie modellen – Effect modificatie......................................................................... 83
Week 5: Predictiemodellen ............................................................................................................................ 87
College: Predictie modellen .............................................................................................................................. 87
Week 6: Overlevingsdata & Cox regressie ....................................................................................................... 97
College: Survivalanalyse ................................................................................................................................... 97
Kennisclip: Survivalanalyse ............................................................................................................................. 110
,Week 1: Herhaling en T-toetsen
College 1: herhaling en t-toetsen
Leerdoelen:
1. Het begrijpen en kunnen reproduceren van de opgedane statistische kennis van
Epidemiologie en Biostatistiek I / Methodologie I; en het kunnen toepassen van deze
kennis op eenvoudige datasets, en de uitkomsten kunnen interpreteren.
2. De theoretische achtergrond bij de in de cursus behandelde nieuwe statistische
technieken/modellen begrijpen en kunnen uitleggen (niveau 200).
3. De best passende statistische techniek/model kiezen bij het gegeven
onderzoeksdesign en de gemeten variabelen kunnen evalueren en interpreteren.
4. Onderzoeksgegevens van de besproken technieken kunnen toetsen, analyseren, en
interpreteren in het statistische softwarepakket SPSS
5. In staat zijn tot een kritische beoordeling van statistische methoden en de
uitkomsten in de context van een onderzoekscasus.
College = introductie in onderwerp van de week
Kennisclips = verdieping van dit onderwerp in de kennisclips (kijken na college)
Theorie tentamen: 40%
SPSS tentamen: 40%
Peerreview opdracht: 20%
Module 1
Frequentiematen en effectmaten
• Dichotoom versus continu
• OR, RR, NNT, APb, Apt
• Welke maat gebruik je wanneer?
Quizvraag 1
Uit Ríos-Hernandez et al. (2017) Pediatrics 139(2)
“Results: Lower adherence to a Mediterranean diet was associated with ADHD diagnosis
(odds ratio: 7.07; 95% confidence interval: 2.65-18.84…)”
Welk studiedesign verwacht je op grond van deze informatie?
a) Patiënt-controlestudie
b) Prospectieve cohortstudie
c) Experimenteel onderzoek
d) Ecologische studie
Het is niet 100% zeker welk studiedesign hier is gebruikt. In de praktijk blijkt dit
echter een Patiënt-controlestudie te zijn en dat is gegeven de onderzoeksvraag en de
effectmaat ook redelijk af te leiden.
a) Een patiënt-controlestudie is aantrekkelijk als de uitkomst zeldzaam is. Dat is niet echt
het geval bij ADHD. Daarbuiten is een patiënt-controlestudie aantrekkelijk als je
relatief snel resultaat wilt. Immers: je kunt terugvragen in de tijd en hoeft daarvoor
, niet een groep mensen langdurig te volgen. Dat is bij deze vraagstelling wel
interessant. Als je namelijk prospectief het al dan niet optreden van ADHD moet
volgen, dan kost dat heel veel tijd. Als je in de running de “adherence to” een
mediterraan dieet moet blijven volgen, dan is dat weliswaar ongetwijfeld theoretisch
een goed idee, maar praktisch erg lastig. Je kunt dan bijna net zo goed even
terugvragen in hoeverre mensen een mediterraan dieet volgen. De effectmaat, een
OR, suggereert daarbuiten niet zozeer een prospectieve opzet (dan was misschien
een RR gepubliceerd)
b) Een prospectief cohort valt zeker niet uit te sluiten op grond van de informatie, maar
ik zou het niet verwachten. Dan zul je een groep mensen moeten volgen die nog geen
ADHD heeft (en dus at risk is) en dan ADHD kan gaan ontwikkelen, afhankelijk van het
toepassen van een al dan niet mediterraan dieet. Dat wordt een langdurige studie en
een weldenkende onderzoeker zou dat niet zo snel zo aanpakken.
c) Een experimenteel onderzoek valt ook niet echt uit te sluiten, maar het is de vraag of
zo’n experiment gaat lukken. Zie je het voor je dat je de ene groep mensen jarenlang
een mediterraan dieet voorschrijft en een andere groep een dieet met mediterraan
karakter verbiedt? Om dan maar af te wachten of de cumulatieve incidentie van
ADHD tussen deze groepen verschilt? Dat lijkt me praktisch eigenlijk onhaalbaar.
d) Bij een ecologische studie worden metingen op geaggregeerd niveau gedaan. Maar
hier lijkt het wel degelijk te gaan om onderzoeksgegevens op individueel niveau,
anders zou je ook niet komen tot een OR.
Ergo: antwoord a) ligt het meeste voor de hand.
, Module 2
Vertekening: de gevonden associatie ≠ de werkelijke
Selecte – selectieprobleem: steekproef representeert de populatie niet
• Non-differentiële selecte: selectiekans is niet voor iedereen gelijk. Associatie in
onderzoekspopulatie = associatie in doelpopulatie
• Differentiële selectie: kans voor ene groep om in onderzoekspopulatie terecht te
komen ≠ kans voor andere groep om in onderzoekspopulatie terecht te komen
Misclassificatie – meetprobleem
• Non-differentiële misclassificatie: meetfout is voor iedereen in de studie gelijk
• Differentiële misclassificatie: meetfout verschilt per groep
Quizvraag 2
• In een studie naar de relatie tussen beeldschermgebruik en voedingsgewoonten
waren relatief veel gemeenteambtenaren geïncludeerd. De vragenlijst naar
voedingsgewoonten bleek de calorie-inname te onderschatten
• Welk soort vertekening valt op grond hiervan te verwachten?
a) Differentiële selectie; non-differentiële misclassificatie
b) Non-differentiële selectie; non-differentiële misclassificatie
c) Geen selectie; differentiële misclassificatie
d) Differentiële selectie en misclassificatie
Net als bij de eerste quizvraag geldt hier dat de “waarheid” niet echt duidelijk is. Ik zou zelf
twijfelen tussen a) en b)
a) Er is duidelijk sprake van selectie, want “relatief veel gemeenteambtenaren” is daar
een teken van. Dan is de vraag of de selectie differentieel is. Dat zou betekenen dat
de relatie tussen beeldschermgebruik en voedingsgewoonten anders is voor
gemeenteambtenaren dan voor andere beroepsgroepen. Nu wil ik best geloven dat
gemeenteambtenaren misschien meer beeldschermen gebruiken dan de meeste
andere beroepsgroepen. Wellicht is het ook wel zo dat gemeenteambtenaren een
ander voedingspatroon hebben dan andere beroepen. Maar het gaat erom of de
relatie tussen die twee anders is dan bij andere beroepsgroepen. Daar ga ik
persoonlijk niet echt vanuit, maar ik kan het best mis hebben. Alleen daarom is het
wat mij betreft niet antwoord a.
b) Om dezelfde reden ga ik dus uit van non-differentiële selectie. We moeten ons
vervolgens richten op misclassificatie. Er is zeker sprake van misclassificatie, want de
vragenlijst zorgt voor een onderschatting van de calorie-inname. Dat is een meetfout
en daarmee een vorm van misclassificatie. De vraag die vervolgens beantwoord moet
worden, is of de meetfout anders uitpakt voor verschillende beroepsgroepen. Daar
lijkt het gegeven de context van de vraag niet per se op, sterker nog: er is niets
aangegeven dat daarop wijst. Dat betekent dat de misclassificatie naar alle
waarschijnlijkheid non-differentieel is. Daarom zou ik gaan voor dit antwoord.