Epidemiologie en biostatistiek 2
kennisclips
Kennisclip 1: 1-steekproef t-toets
We gebruiken t-toetsen als de sd in de populatie onbekend is.
Gebruik van t-toetsen:
- Uitkomsten zijn kwantitatief
- Gemiddelde van steekproef, staat model voor populatieparameter mu
- Standaardafwijking, sd, staat model voor populatieparameter sigma
- Gemiddelde moet kunnen worden beschouwd als trekking uit een normale verdeling
Belangrijke conceptuele gedachte
- De waarde van x en sd zijn onderling onafhankelijk van elkaar
Heb je x berekend, dan zegt dit nog niets over de waarde van sd
- Vanwege deze dubbele onzekerheid maken we gebruik van de t-verdeling
Aantal vrijheidsgraden bepaalt in hoeverre de t-verdeling lijkt op een z-verdeling (hoe
meer informatie, hoe meer de t-toets lijkt op een z-verdeling)
Vrijheidsgraden = n-1 (per onderzoeksgroep)
Bij 1-steekproef t-toets (one sample t-test)
- Vergelijk je een uitkomst met een normwaarde
- Normwaarde staat onder H0
- Het onderzoek betreft (bijna altijd) een transversaal cohort (geen tijdfactor en maar 1
groep)
- Centrale vraag: hoe verhoudt de situatie zich in vergelijking tot de norm?
- Voorwaarden:
Gegevens zijn onderling onafhankelijk – dus niet gegroepeerd
Schatting voor mu is normaal verdeeld
Voorwaarden checken:
- Onafhankelijkheid gegevens checken
- Gemiddelde getrokken uit een normale verdeling
Bekijk Q-Q plot of histogram op het oog, niet met een toets
Reden: vrijwel alle kans variabelen zijn niet perfect normaal verdeeld
Zolang n maar groot genoeg is zul je bij toetsing afwijkingen t.a.v. normaliteit vinden
Bij kleine n zullen relevante afwijkingen t.a.v. normaliteit niet aantoonbaar zijn
Daarom is een toets op normaliteit zelden/nooit van toegevoegde waarde
,Toetsingsgrootheid:
- Maat waarmee we meten hoeveel onze bevindingen afwijken van de verwachting onder
H0
Mu0 = verwachting H0
- Resultaat is aantal standaarddeviaties binnen de t-verdeling
Overschrijdingskans
- Hoeveel bedraagt de kans om een resultaat te vinden dat 1,96 sd’s of meer afwijkt van
de verwachting onder H0 als het basaal metabolisme van topsporters en niet-
topsporters in werkelijkheid niet verschilt?
- Berekenen met SPSS 7,1% = meer dan 5% dus niet significant
Kanttekeningen
- Aanmerkingen op de proefopzet
Wie zegt dat de populatieverwachting van lichaamstemperatuur 37 graden is
N = 14 is niet bepaald veel; groot effect verwacht voor significantie er kan ook niet
worden uitgesloten dat topsporters hyperthermisch zijn
Geen informatie over meetprocedure en steekproefname slimme opzet kan spreiding
verminderen
Betrouwbaarheidsinterval
T = bij welk aantal standaardafwijkingen in een t-verdeling met 13 vrijheidsgraden geldt een
overschrijdingskans van 5% (kan je gewoon opzoeken)
, Kennisclip 2: gepaarde t-toets
Studieontwerp bij een gepaarde t-toets
- Vergelijken van 2 waarnemingen aan dezelfde eenheid met elkaar
Bv. verschilt bloeddruk tussen de oudste (1) en de jongste (2) van een tweeling (eenheid)
- Passen bij een prospectieve studie
- Voorwaarden:
Eenheden zijn onderling onafhankelijk – dus niet gegroepeerd
Waarnemingen juiste wel afhankelijk (binnen eenheid)
Het gemiddelde van verschilmetingen is normaal verdeeld (CLS)
Het verschil is onafhankelijk van de meetwaarde op t = 0
Voorbeeld:
- Hypothetische gedachte
Voor fysieke training verbrand je energie exotherm proces
Hebben topsporters na een matig intensieve training een hogere lichaamstemperatuur
dan ervoor?
- Onderzoekje bij 21 sporters iedereen 2 metingen
Relatie 1 steekproef t-toets en gepaarde t-toets
- Door gepaarde waarnemingen te reduceren tot 1 verschil is de rest helemaal hetzelfde
als de 1-steekproef t-toets
- Alleen symbolen zijn anders
Check de aannames
- Deelnemers aan de studie onafhankelijk?
- Waarnemingen steeds in paren?
- Kan d als trekking uit een normale verdeling? Q-Q plot of histogram
- De verschilscore is onafhankelijk van de waarde op t=0
Te bekijken door de temperatuur op t=0 op de horizontale as en de verschilscores op de
verticale as te zetten
Beoordeel op het oog of er een relatie is
Q-Q plot:
- Wanneer punten rond rechte lijn liggen (geen systematisch afwijkend patroon), mag
verondersteld worden dat gegevens redelijkerwijze passen bij een normale verdeling
- Afwijkingen in patroon zijn minder erg naarmate n toeneem (CLS)
Toetsingsgrootheid:
kennisclips
Kennisclip 1: 1-steekproef t-toets
We gebruiken t-toetsen als de sd in de populatie onbekend is.
Gebruik van t-toetsen:
- Uitkomsten zijn kwantitatief
- Gemiddelde van steekproef, staat model voor populatieparameter mu
- Standaardafwijking, sd, staat model voor populatieparameter sigma
- Gemiddelde moet kunnen worden beschouwd als trekking uit een normale verdeling
Belangrijke conceptuele gedachte
- De waarde van x en sd zijn onderling onafhankelijk van elkaar
Heb je x berekend, dan zegt dit nog niets over de waarde van sd
- Vanwege deze dubbele onzekerheid maken we gebruik van de t-verdeling
Aantal vrijheidsgraden bepaalt in hoeverre de t-verdeling lijkt op een z-verdeling (hoe
meer informatie, hoe meer de t-toets lijkt op een z-verdeling)
Vrijheidsgraden = n-1 (per onderzoeksgroep)
Bij 1-steekproef t-toets (one sample t-test)
- Vergelijk je een uitkomst met een normwaarde
- Normwaarde staat onder H0
- Het onderzoek betreft (bijna altijd) een transversaal cohort (geen tijdfactor en maar 1
groep)
- Centrale vraag: hoe verhoudt de situatie zich in vergelijking tot de norm?
- Voorwaarden:
Gegevens zijn onderling onafhankelijk – dus niet gegroepeerd
Schatting voor mu is normaal verdeeld
Voorwaarden checken:
- Onafhankelijkheid gegevens checken
- Gemiddelde getrokken uit een normale verdeling
Bekijk Q-Q plot of histogram op het oog, niet met een toets
Reden: vrijwel alle kans variabelen zijn niet perfect normaal verdeeld
Zolang n maar groot genoeg is zul je bij toetsing afwijkingen t.a.v. normaliteit vinden
Bij kleine n zullen relevante afwijkingen t.a.v. normaliteit niet aantoonbaar zijn
Daarom is een toets op normaliteit zelden/nooit van toegevoegde waarde
,Toetsingsgrootheid:
- Maat waarmee we meten hoeveel onze bevindingen afwijken van de verwachting onder
H0
Mu0 = verwachting H0
- Resultaat is aantal standaarddeviaties binnen de t-verdeling
Overschrijdingskans
- Hoeveel bedraagt de kans om een resultaat te vinden dat 1,96 sd’s of meer afwijkt van
de verwachting onder H0 als het basaal metabolisme van topsporters en niet-
topsporters in werkelijkheid niet verschilt?
- Berekenen met SPSS 7,1% = meer dan 5% dus niet significant
Kanttekeningen
- Aanmerkingen op de proefopzet
Wie zegt dat de populatieverwachting van lichaamstemperatuur 37 graden is
N = 14 is niet bepaald veel; groot effect verwacht voor significantie er kan ook niet
worden uitgesloten dat topsporters hyperthermisch zijn
Geen informatie over meetprocedure en steekproefname slimme opzet kan spreiding
verminderen
Betrouwbaarheidsinterval
T = bij welk aantal standaardafwijkingen in een t-verdeling met 13 vrijheidsgraden geldt een
overschrijdingskans van 5% (kan je gewoon opzoeken)
, Kennisclip 2: gepaarde t-toets
Studieontwerp bij een gepaarde t-toets
- Vergelijken van 2 waarnemingen aan dezelfde eenheid met elkaar
Bv. verschilt bloeddruk tussen de oudste (1) en de jongste (2) van een tweeling (eenheid)
- Passen bij een prospectieve studie
- Voorwaarden:
Eenheden zijn onderling onafhankelijk – dus niet gegroepeerd
Waarnemingen juiste wel afhankelijk (binnen eenheid)
Het gemiddelde van verschilmetingen is normaal verdeeld (CLS)
Het verschil is onafhankelijk van de meetwaarde op t = 0
Voorbeeld:
- Hypothetische gedachte
Voor fysieke training verbrand je energie exotherm proces
Hebben topsporters na een matig intensieve training een hogere lichaamstemperatuur
dan ervoor?
- Onderzoekje bij 21 sporters iedereen 2 metingen
Relatie 1 steekproef t-toets en gepaarde t-toets
- Door gepaarde waarnemingen te reduceren tot 1 verschil is de rest helemaal hetzelfde
als de 1-steekproef t-toets
- Alleen symbolen zijn anders
Check de aannames
- Deelnemers aan de studie onafhankelijk?
- Waarnemingen steeds in paren?
- Kan d als trekking uit een normale verdeling? Q-Q plot of histogram
- De verschilscore is onafhankelijk van de waarde op t=0
Te bekijken door de temperatuur op t=0 op de horizontale as en de verschilscores op de
verticale as te zetten
Beoordeel op het oog of er een relatie is
Q-Q plot:
- Wanneer punten rond rechte lijn liggen (geen systematisch afwijkend patroon), mag
verondersteld worden dat gegevens redelijkerwijze passen bij een normale verdeling
- Afwijkingen in patroon zijn minder erg naarmate n toeneem (CLS)
Toetsingsgrootheid: