Medisch Wetenschappelijk Onderzoek 2 Colleges
d
6/5
Introductie MWO2
Onderzoeksvraag: PICO(T) methode;
• P --> patiënt, populatie
• I --> interventie
• C --> comparison, controle
• O --> outcome
• T --> tijd (indien relevant)
Onderzoeksvormen;
• Prospectief --> je volgt mensen over de tijd; je meet de determinant en gaat kijken
wie de uitkomst krijgt
o Experimenteel: toewijzen determinant aan groepen (RCT), kan iets zeggen
over causaliteit
o Observationeel: groep mensen wel/niet blootgesteld aan determinant,
afwachten wie de ziekte krijgt
• Retrospectief --> je zoekt mensen die de ziekte heeft en zoekt bijpassende controle
groep bij, je vraagt terug naar de determinant
o Recall bias!!
o Geschikt voor zeldzame ziektes
+ -
Cohort Natuurlijk beloop: causaliteit Duur
(relatief risico) Meerdere ziekte uitkomsten kunnen Inefficiënt: veel mensen lange tijd
onderzocht worden volgen
Absoluut risico is te bepalen
Case-control Goedkoop Cases en controles geselecteerd op basis
(odds ratio) Snel en efficiënt: vooral bij zeldzame van beschikbaarheid
ziektes Geen rechtstreekse maat voor risico
Bronnen van vertekening;
• Confounding: verstorende variabele die een relatie heeft met determinant en
uitkomstmaat en daardoor de relatie beïnvloedt --> relatie tussen determinant en
uitkomstmaat wordt sterker/zwakker.
• Effectmodificatie: relatie tussen determinant en uitkomstmaat is anders voor 2
verschillende groepen (bijv. mannen/vrouwen).
Hoe smaller je betrouwbaarheidsinterval, hoe nauwkeuriger je hebt gemeten, en hoe beter
je gemiddelde in de steekproef een benadering is van het gemiddelde in de populatie.
Toetsen:
• P-waarde --> statistische significantie
• Effectgrootte --> klinische relevantie
,Meetniveaus:
• Continu
• Categoriaal
• Dichotoom
> Bepaalt welke analysetechniek je kan gebruiken
d
Continue uitkomsten I
Continue uitkomst --> lineaire regressie analyse
Dichotome uitkomst --> logistische regressie analyse
Survival data --> cox regressie analyse
Continue Dichotoom Dichotoom + tijd
2 groepen Onafhankelijke T-toets Chi-kwadraat / Fisher Log rank toets
Verschil gemiddelden exact
RV / RR / OR
>2 groepen Variantie analyse (ANOVA) Chi-kwadraat / Fisher Log rank toets
Verschil gemiddelden exact
{RV / RR / OR}
Relatie met andere Lineaire regressie Logistische regressie Cox regressive
variabelen Regressie coëfficiënt OR HR
Keuze voor een statistische techniek;
• Onderzoeksvraag
• Verdeling van de uitkomstvariabele
o Continu of discreet (= hele getallen)
o Dichotoom
o Dichotoom + tijd (survival data)
Statistiek is nodig om de ‘onzekerheid’ van het gevonden resultaat te kwantificeren. De
onbetrouwbaarheid van het gevonden resultaat zit hem in de grootte van de steekproef
(hoe kleiner, hoe groter) en de standaarddeviatie (hoe hoger, hoe groter).
Schatten --> effect (= verschil tussen gemiddelde waardes) + betrouwbaarheidsinterval
Statistisch toetsen --> berekenen van de kans op het gevonden resultaat (of nog extremer
weg van de nulhypothese) als eigenlijk de nulhypothese waar is
Belangrijke aanname: de uitkomstvariabele is normaal verdeeld. Wat doen we als dit niet
het geval is?
• Transformatie (bijv. log-transformatie bij scheef naar rechts verdeling)
• Non-parametrische toetsen
Variantie = standaarddeviatie2
Variantie analyse --> wat zijn de verschillen, hoe groot zijn deze en zijn deze te verklaren
door het verschil in groepen
• Als p-waarde niet significant is --> stoppen met variantie analyse
, • Als p-waarde wel significant is --> gebruikelijk om post hoc procedure uit te voeren
(hierbij ga je de 3 groepen met elkaar vergelijken (met 3 t-toetsen)) (bij multiple
testing moet je corrigeren (bijv. Bonferroni))
Met zowel een continue onafhankelijke als uitkomst kan je een scatterplot maken. Hier
staan alle observaties in. Bij lineaire regressie analyse ga je deze aan elkaar relateren en
beschrijven hoe de relatie is, door een rechte lijn te trekken in de scatterplot. Deze lijn wordt
geschat met de ‘kleinste kwadraten methode’. De eigenschap van deze lijn is dat de afstand
van de puntjes tot de geschatte lijn zo klein mogelijk is. De rechte lijn wordt gekarakteriseerd
door 2 parameters:
• B0 --> waarde van de uitkomst, als de onafhankelijke variabele 0 is (Constant)
• B1 --> regressie coëfficiënt (= het verschil in uitkomstvariabele als de onafhankelijke
variabele 1 eenheid verschilt) (bij dichotome onafhankelijke variabele --> mean
difference)
Zowel het verschil tussen 2 groepen als het verschil tussen 3 groepen kan ook geanalyseerd
worden met behulp van lineaire regressie analyse.
Toetsen van de regressie: t = B / SE(B)
Bij een categoriale onafhankelijke variabele en een continue uitkomstmaat wordt gebruik
gemaakt van dummy variabelen. Dit zijn dichotome variabelen (0/1) en die horen bij elkaar
als je een categoriale variabele wilt analyseren. Je maakt altijd het aantal groepen – 1
dummy variabelen. Om deze vervolgens in een regressie analyse te stoppen.
Correlatie coëfficiënt (standardized coefficients; Beta) --> hoe goed de punten op de
regressielijn liggen kan worden gekwantificeerd met de correlatie coëfficiënt: ligt altijd
tussen -1 en +1 en is niet hetzelfde als de regressie coëfficiënt. Hoe hoger de correlatie, hoe
kleiner de standaard fout (SE).
Binnen de epidemiologie zijn we meer geïnteresseerd in regressie coëfficiënten en minder in
correlatie coëfficiënten.
Onderzoeken lineariteit van de relatie met continue onafhankelijke variabelen;
• Wiskundige functie
o Kwadratische functie --> checken of dit beter is dan lineair verband door:
§ Kwadratische functie modelleren
§ Regressie analyse waarbij zowel de ‘normale’ variabele als de
kwadratische versie hiervan
§ Als de p-waarde van de regressiecoëfficiënt van de kwadratische
functie kleiner is dan 0,05 --> kwadraat voegt iets toe / is beter
• Verdelen van de onafhankelijke variabele in groepen
o Meestal 4 groepen, kwartielen, waar je 3 dummy variabelen van gaat maken
o Op basis van de 3 regressiecoëfficiënten + de gemiddelde waardes die je dan
krijgt, kan je een uitspraak doen over of er een lineair verband is
Niet normaal verdeelde uitkomstvariabelen; hoe moeten we omgaan met scheve
verdelingen?
• Scheef naar rechts --> logtransformatie (LN)
d
6/5
Introductie MWO2
Onderzoeksvraag: PICO(T) methode;
• P --> patiënt, populatie
• I --> interventie
• C --> comparison, controle
• O --> outcome
• T --> tijd (indien relevant)
Onderzoeksvormen;
• Prospectief --> je volgt mensen over de tijd; je meet de determinant en gaat kijken
wie de uitkomst krijgt
o Experimenteel: toewijzen determinant aan groepen (RCT), kan iets zeggen
over causaliteit
o Observationeel: groep mensen wel/niet blootgesteld aan determinant,
afwachten wie de ziekte krijgt
• Retrospectief --> je zoekt mensen die de ziekte heeft en zoekt bijpassende controle
groep bij, je vraagt terug naar de determinant
o Recall bias!!
o Geschikt voor zeldzame ziektes
+ -
Cohort Natuurlijk beloop: causaliteit Duur
(relatief risico) Meerdere ziekte uitkomsten kunnen Inefficiënt: veel mensen lange tijd
onderzocht worden volgen
Absoluut risico is te bepalen
Case-control Goedkoop Cases en controles geselecteerd op basis
(odds ratio) Snel en efficiënt: vooral bij zeldzame van beschikbaarheid
ziektes Geen rechtstreekse maat voor risico
Bronnen van vertekening;
• Confounding: verstorende variabele die een relatie heeft met determinant en
uitkomstmaat en daardoor de relatie beïnvloedt --> relatie tussen determinant en
uitkomstmaat wordt sterker/zwakker.
• Effectmodificatie: relatie tussen determinant en uitkomstmaat is anders voor 2
verschillende groepen (bijv. mannen/vrouwen).
Hoe smaller je betrouwbaarheidsinterval, hoe nauwkeuriger je hebt gemeten, en hoe beter
je gemiddelde in de steekproef een benadering is van het gemiddelde in de populatie.
Toetsen:
• P-waarde --> statistische significantie
• Effectgrootte --> klinische relevantie
,Meetniveaus:
• Continu
• Categoriaal
• Dichotoom
> Bepaalt welke analysetechniek je kan gebruiken
d
Continue uitkomsten I
Continue uitkomst --> lineaire regressie analyse
Dichotome uitkomst --> logistische regressie analyse
Survival data --> cox regressie analyse
Continue Dichotoom Dichotoom + tijd
2 groepen Onafhankelijke T-toets Chi-kwadraat / Fisher Log rank toets
Verschil gemiddelden exact
RV / RR / OR
>2 groepen Variantie analyse (ANOVA) Chi-kwadraat / Fisher Log rank toets
Verschil gemiddelden exact
{RV / RR / OR}
Relatie met andere Lineaire regressie Logistische regressie Cox regressive
variabelen Regressie coëfficiënt OR HR
Keuze voor een statistische techniek;
• Onderzoeksvraag
• Verdeling van de uitkomstvariabele
o Continu of discreet (= hele getallen)
o Dichotoom
o Dichotoom + tijd (survival data)
Statistiek is nodig om de ‘onzekerheid’ van het gevonden resultaat te kwantificeren. De
onbetrouwbaarheid van het gevonden resultaat zit hem in de grootte van de steekproef
(hoe kleiner, hoe groter) en de standaarddeviatie (hoe hoger, hoe groter).
Schatten --> effect (= verschil tussen gemiddelde waardes) + betrouwbaarheidsinterval
Statistisch toetsen --> berekenen van de kans op het gevonden resultaat (of nog extremer
weg van de nulhypothese) als eigenlijk de nulhypothese waar is
Belangrijke aanname: de uitkomstvariabele is normaal verdeeld. Wat doen we als dit niet
het geval is?
• Transformatie (bijv. log-transformatie bij scheef naar rechts verdeling)
• Non-parametrische toetsen
Variantie = standaarddeviatie2
Variantie analyse --> wat zijn de verschillen, hoe groot zijn deze en zijn deze te verklaren
door het verschil in groepen
• Als p-waarde niet significant is --> stoppen met variantie analyse
, • Als p-waarde wel significant is --> gebruikelijk om post hoc procedure uit te voeren
(hierbij ga je de 3 groepen met elkaar vergelijken (met 3 t-toetsen)) (bij multiple
testing moet je corrigeren (bijv. Bonferroni))
Met zowel een continue onafhankelijke als uitkomst kan je een scatterplot maken. Hier
staan alle observaties in. Bij lineaire regressie analyse ga je deze aan elkaar relateren en
beschrijven hoe de relatie is, door een rechte lijn te trekken in de scatterplot. Deze lijn wordt
geschat met de ‘kleinste kwadraten methode’. De eigenschap van deze lijn is dat de afstand
van de puntjes tot de geschatte lijn zo klein mogelijk is. De rechte lijn wordt gekarakteriseerd
door 2 parameters:
• B0 --> waarde van de uitkomst, als de onafhankelijke variabele 0 is (Constant)
• B1 --> regressie coëfficiënt (= het verschil in uitkomstvariabele als de onafhankelijke
variabele 1 eenheid verschilt) (bij dichotome onafhankelijke variabele --> mean
difference)
Zowel het verschil tussen 2 groepen als het verschil tussen 3 groepen kan ook geanalyseerd
worden met behulp van lineaire regressie analyse.
Toetsen van de regressie: t = B / SE(B)
Bij een categoriale onafhankelijke variabele en een continue uitkomstmaat wordt gebruik
gemaakt van dummy variabelen. Dit zijn dichotome variabelen (0/1) en die horen bij elkaar
als je een categoriale variabele wilt analyseren. Je maakt altijd het aantal groepen – 1
dummy variabelen. Om deze vervolgens in een regressie analyse te stoppen.
Correlatie coëfficiënt (standardized coefficients; Beta) --> hoe goed de punten op de
regressielijn liggen kan worden gekwantificeerd met de correlatie coëfficiënt: ligt altijd
tussen -1 en +1 en is niet hetzelfde als de regressie coëfficiënt. Hoe hoger de correlatie, hoe
kleiner de standaard fout (SE).
Binnen de epidemiologie zijn we meer geïnteresseerd in regressie coëfficiënten en minder in
correlatie coëfficiënten.
Onderzoeken lineariteit van de relatie met continue onafhankelijke variabelen;
• Wiskundige functie
o Kwadratische functie --> checken of dit beter is dan lineair verband door:
§ Kwadratische functie modelleren
§ Regressie analyse waarbij zowel de ‘normale’ variabele als de
kwadratische versie hiervan
§ Als de p-waarde van de regressiecoëfficiënt van de kwadratische
functie kleiner is dan 0,05 --> kwadraat voegt iets toe / is beter
• Verdelen van de onafhankelijke variabele in groepen
o Meestal 4 groepen, kwartielen, waar je 3 dummy variabelen van gaat maken
o Op basis van de 3 regressiecoëfficiënten + de gemiddelde waardes die je dan
krijgt, kan je een uitspraak doen over of er een lineair verband is
Niet normaal verdeelde uitkomstvariabelen; hoe moeten we omgaan met scheve
verdelingen?
• Scheef naar rechts --> logtransformatie (LN)