SAMENVATTING EPIDEMIOLOGIE EN BIOSTATISTIEK I
Frequentiematen:
(Punt)prevalentie: aantal zieken op een bepaald moment (transversaal). Periodeprevalentie: aantal
zieken in een bepaalde periode. Lifetime-prevalentie: of de ziekte bij een persoon tot het moment
van meten ooit is voorgekomen. Bestaande ziektegevallen/aantal mensen
Cumulatieve Incidentie: nieuwe gevallen in een populatie die “at risk” is in een bepaalde tijdsperiode.
Mensen “loss to follow up” niet meenemen. Nieuwe ziektegevallen/aantal mensen “at risk”
Incidentie(dichtheid): nieuwe ziektegevallen/totale persoonstijd “at risk”.
Sterftecijfer: sterftegevallen/aantal mensen. Incidentie van overlijden. Voor het vergelijken van
landen gestandaardiseerd sterftecijfer gebruiken.
Beschrijvende statistiek:
Meetschalen:
Dichotoom; wel of niet, dus maar twee categorieën
Nominaal; uitkomst in te delen in vast aantal categorieën, maar die zijn niet eenduidige te ordenen,
dus er zit gene rang of iets dergelijks in. Bijvoorbeeld beroep.
Ordinaal; uitkomst in te delen in een beperkt aantal vaste categorieën welke eenduidig te ordenen
zijn. Bijvoorbeeld opleiding.
Discreet; uitkomst uitgedrukt in eenheden net telkens dezelfde afstand of stapjes tussen de
eenheden. Ook wel telvariabele genoemd. Dit is meestal een getal zonder komma. Bijvoorbeeld
hartslag.
Continu; uitkomst kan elke mogelijke waarde aannemen van begin tot eind van de meetschaal,
inclusief komma’s. Bijvoorbeeld bloeddruk, gewicht en lengte.
Om met categoriale gegevens te werken moet je elke categorie een nummer meegeven. Numeriek
beschrijven in een frequentietabel en grafisch beschrijven in een staaf- of taartdiagram.
Continue gegevens numeriek beschrijven is zeer lastig door de vele gegevens. Oplossing:
samenvattende gegevens. Geldt ALLEEN voor continue gegevens. Samenvattende gegevens voor
locatie: gemiddelde, mediaan en modus. Samenvattende gegevens voor spreiding: bereik (min tot
x i x xi x
2 2
max), variantie ( n 1 ), standaardafwijking (σ n 1 ) en de interkwartielafstand (de
e e
middelste 50% van de waardes, dus tussen 1 en 3 kwartiel)
Continue gegevens grafisch beschrijven kan op meerder manieren: histogram, box- en whiskerplot,
stem and leafplot.
Aan een histogram kun je zien of een continue variabele normaal, scheef naar recht of scheef naar
links verdeeld is. Een normale verdeling is belangrijk voor veel statistische toetsen. Oplossing om van
een scheve naar een normale verdeling te komen: logtransformatie met ln.
Hoe de normaliteit te checken (zowel voor als na logtransformatie)?
1. Bij positieve waardes: gemiddelde met mediaan vergelijken
2. Histogram met normal curve
3. Normal Q-Q plot
, Voorbereiding bij een data-analyse:
- Check of er uitbijters/extreme waardes zijn bij continue variabelen (te checken in SPSS)
- Check of er missende waardes zijn. Zijn deze nog te achterhalen? Zijn ze terecht/onterecht
missend? Zijn er redenen voor ontbreken? Missende waardes in SPSS aangeven met ‘9’. In SPSS
kijken naar de valide waardes, die nemen de missende waardes niet mee.
Onderzoeksdesigns:
Observationeel: Cohort/Case-control
Retrospectief (1) Retrospectief (4)
Transversaal (2)
Prospectief (3) Nested case-control (5)
Experimenteel: cohort prospectief (6)
Voor-/nadelen:
1. Voor:
- Oorzaak voor gevolg
Tegen:
- Selectiebias/confounding
- Informatiebias doordat je terugvraagt
- Inefficiënt; groot cohort nodig
2. Voor:
- Weinig kans op informatiebias
Tegen:
- Er wordt niet eerst naar de oorzaak gekeken, maar naar het gevolg.
- Er kan selectiebias/confounding optreden
- Het is inefficiënt; er is een groot cohort nodig
3. Voor:
- Minder selectie- en informatiebias doordat er wordt gemeten vóór de ziekte optreedt.
- Er wordt gekeken naar de oorzaak vóór het gevolg optreedt
- Verschillende uitkomsten/blootstellingen kunnen bekeken worden
Tegen:
- Mogelijke confounding en selectiebias door loss to follow-up
- Onpraktisch en duur bij zeldzame ziekte of lange incubatietijd
- Vooraf inzicht in mogelijke determinanten noodzakelijk
4. Tegen:
- Selectiebias door het selecteren van groepen
- Informatiebias/confounding
5. Voor:
- Goedkope oplossing als (3) te duur is
- Toch prospectief, dus weinig kans op selectie- en informatiebias
- Random selectie controles uit basispopulatie
Tegen:
- Confounding mogelijk
- Nog steeds minder efficiënt dan case-control
6. Voor:
- Oorzaak voor gevolg
- Weinig kans op confounding
Tegen:
- Vaak ethisch niet verantwoord, dus onuitvoerbaar
Frequentiematen:
(Punt)prevalentie: aantal zieken op een bepaald moment (transversaal). Periodeprevalentie: aantal
zieken in een bepaalde periode. Lifetime-prevalentie: of de ziekte bij een persoon tot het moment
van meten ooit is voorgekomen. Bestaande ziektegevallen/aantal mensen
Cumulatieve Incidentie: nieuwe gevallen in een populatie die “at risk” is in een bepaalde tijdsperiode.
Mensen “loss to follow up” niet meenemen. Nieuwe ziektegevallen/aantal mensen “at risk”
Incidentie(dichtheid): nieuwe ziektegevallen/totale persoonstijd “at risk”.
Sterftecijfer: sterftegevallen/aantal mensen. Incidentie van overlijden. Voor het vergelijken van
landen gestandaardiseerd sterftecijfer gebruiken.
Beschrijvende statistiek:
Meetschalen:
Dichotoom; wel of niet, dus maar twee categorieën
Nominaal; uitkomst in te delen in vast aantal categorieën, maar die zijn niet eenduidige te ordenen,
dus er zit gene rang of iets dergelijks in. Bijvoorbeeld beroep.
Ordinaal; uitkomst in te delen in een beperkt aantal vaste categorieën welke eenduidig te ordenen
zijn. Bijvoorbeeld opleiding.
Discreet; uitkomst uitgedrukt in eenheden net telkens dezelfde afstand of stapjes tussen de
eenheden. Ook wel telvariabele genoemd. Dit is meestal een getal zonder komma. Bijvoorbeeld
hartslag.
Continu; uitkomst kan elke mogelijke waarde aannemen van begin tot eind van de meetschaal,
inclusief komma’s. Bijvoorbeeld bloeddruk, gewicht en lengte.
Om met categoriale gegevens te werken moet je elke categorie een nummer meegeven. Numeriek
beschrijven in een frequentietabel en grafisch beschrijven in een staaf- of taartdiagram.
Continue gegevens numeriek beschrijven is zeer lastig door de vele gegevens. Oplossing:
samenvattende gegevens. Geldt ALLEEN voor continue gegevens. Samenvattende gegevens voor
locatie: gemiddelde, mediaan en modus. Samenvattende gegevens voor spreiding: bereik (min tot
x i x xi x
2 2
max), variantie ( n 1 ), standaardafwijking (σ n 1 ) en de interkwartielafstand (de
e e
middelste 50% van de waardes, dus tussen 1 en 3 kwartiel)
Continue gegevens grafisch beschrijven kan op meerder manieren: histogram, box- en whiskerplot,
stem and leafplot.
Aan een histogram kun je zien of een continue variabele normaal, scheef naar recht of scheef naar
links verdeeld is. Een normale verdeling is belangrijk voor veel statistische toetsen. Oplossing om van
een scheve naar een normale verdeling te komen: logtransformatie met ln.
Hoe de normaliteit te checken (zowel voor als na logtransformatie)?
1. Bij positieve waardes: gemiddelde met mediaan vergelijken
2. Histogram met normal curve
3. Normal Q-Q plot
, Voorbereiding bij een data-analyse:
- Check of er uitbijters/extreme waardes zijn bij continue variabelen (te checken in SPSS)
- Check of er missende waardes zijn. Zijn deze nog te achterhalen? Zijn ze terecht/onterecht
missend? Zijn er redenen voor ontbreken? Missende waardes in SPSS aangeven met ‘9’. In SPSS
kijken naar de valide waardes, die nemen de missende waardes niet mee.
Onderzoeksdesigns:
Observationeel: Cohort/Case-control
Retrospectief (1) Retrospectief (4)
Transversaal (2)
Prospectief (3) Nested case-control (5)
Experimenteel: cohort prospectief (6)
Voor-/nadelen:
1. Voor:
- Oorzaak voor gevolg
Tegen:
- Selectiebias/confounding
- Informatiebias doordat je terugvraagt
- Inefficiënt; groot cohort nodig
2. Voor:
- Weinig kans op informatiebias
Tegen:
- Er wordt niet eerst naar de oorzaak gekeken, maar naar het gevolg.
- Er kan selectiebias/confounding optreden
- Het is inefficiënt; er is een groot cohort nodig
3. Voor:
- Minder selectie- en informatiebias doordat er wordt gemeten vóór de ziekte optreedt.
- Er wordt gekeken naar de oorzaak vóór het gevolg optreedt
- Verschillende uitkomsten/blootstellingen kunnen bekeken worden
Tegen:
- Mogelijke confounding en selectiebias door loss to follow-up
- Onpraktisch en duur bij zeldzame ziekte of lange incubatietijd
- Vooraf inzicht in mogelijke determinanten noodzakelijk
4. Tegen:
- Selectiebias door het selecteren van groepen
- Informatiebias/confounding
5. Voor:
- Goedkope oplossing als (3) te duur is
- Toch prospectief, dus weinig kans op selectie- en informatiebias
- Random selectie controles uit basispopulatie
Tegen:
- Confounding mogelijk
- Nog steeds minder efficiënt dan case-control
6. Voor:
- Oorzaak voor gevolg
- Weinig kans op confounding
Tegen:
- Vaak ethisch niet verantwoord, dus onuitvoerbaar