Deelmodule 01-AVV Variantieanalyse......................................................2
WG01-AVV: Variantieanalyse....................................................................8
C01-AVV: Variantieanalyse.....................................................................12
Deelmodule 02-AVV Enkelvoudige lineaire regressie.............................13
WG02-AVV: Enkelvoudige lineaire regressie...........................................18
C02-AVV: Enkelvoudige lineaire regressie..............................................21
Deelmodule 03-AVV Meervoudige lineaire regressie..............................22
WG03-AVV: Meervoudige lineaire regressie............................................30
C03-AVV: Meervoudige lineaire regressie...............................................32
Deelmodule 04-AVV Logistische regressie..............................................35
C04-AVV: Logistische regressie...............................................................40
WG04-AVV: logistische regressie............................................................42
Deelmodule 05-AVV Multivariate analyse in het wild - Van theorie naar
praktijk...................................................................................................45
Deelmodule 06-AVV Multivariate analyse in het wild - Het meten van
effecten van gezondheidszorgbeleid......................................................50
C06-AVV: Multivariate analyse in het wild 2...........................................56
C05-AVV: Multivariate analyse in het wild 1...........................................60
WG06-AVV: Wees gewaarschuwd...........................................................64
WG07-AVV: Capita selecta......................................................................65
,Deelmodule 01-AVV Variantieanalyse
Wat is variantie(analyse)?
Uitbreiding t-toets voor twee onafhankelijke
groepen
Variantieanalyse is verschillenanalyse
Variantie als maat voor spreiding rondom
gemiddelden
Variantie is de standaardafwijking in het kwadraat
Notatie
Populatie: gemiddelde: µ, stdev: σ en variantie:
σ²
Steekproef: gemiddelde: 𝑥 ̅, stdev: S en variantie: S²
Waarom zou je een variantieanalyse willen uitvoeren?
Doel: uitspraak doen over de vraag of de gemiddelden van een zekere
variabele Y in meer dan 2 populaties aan elkaar gelijk zouden kunnen
zijn.
Probleem: populatiegemiddelden zijn onbekend
Oplossing: analyse van verschillen (=variantie!) van Y in steekproeven
uit de afzonderlijke populaties
Wanneer kun en mag je variantieanalyse toepassen?
Afhankelijk van onderzoeksvraag (verschil analyse)
>2 groepen vergelijken
Y is een kwantitatieve variabele (minimaal intervalniveau): bijv.
genezingsduur
De factor is een kwalitatieve variabele (nominaal meetniveau): bijv.
medicijn A, B & C
Variantieanalyse wordt relatief veel gebruikt binnen de medische
wetenschap (experimentele setting): causaliteit
Waarom geen t-toetsen uitvoeren en paarsgewijs gemiddelden
vergelijken?
De kans op het vinden van een statistisch significant verschil stijgt met
het aantal onderlinge vergelijkingen.
Stel je wilt 15 steekproeven onderling vergelijken, dan moet je 105 t-
toetsen uitvoeren, elke keer met 5% kans om H0 ten onrechte te
verwerpen
Dat betekent naar verwachting: 0,05 x 105 = 5 foute conclusies
Drie voorwaarden:
1. Populaties zijn normaal verdeeld
2. Steekproeven hebben gelijk aantal waarnemingen
3. Populaties hebben gelijke variantie
Vuistregel: Grootste standaardafwijking is niet meer dan 2x de
kleinste standaardafwijking
Beter: toets voor gelijkheid varianties
Toets voor gelijkheid varianties stappenplan volg elke stap
Stap 1: Wat is de nulhypothese en de alternatieve hypothese?
, H0: σ1² = σ2² = … σa²
Ha: σ1² ≠ σ2² ≠ … σa², a=aantal groepen
Stap 2: Wat is de toetsingsgrootheid en verdeling?
Toets van Hartley Hmax = S² max/ S² min met Ha, m-1, α verdeling
S² max is de grootste en S² min de kleinste variantie in de steekproeven
Heb je standaardafwijking (S)? Kwadrateer en je hebt de variantie!
Stap 3: Wat is de kritieke grens?
Opzoeken in Hmax–tabel: Ha, m-1, α
a = aantal groepen
m = aantal waarnemingen per groep
α = significantieniveau (e.g. 0,05)
Stap 4: Wat is de conclusie?
Gevonden waarde < kritieke grens? H0 niet verwerpen
Gevonden waarde > kritieke grens? H0 wel verwerpen
Voorbeeld 1
We hebben gezondheidsverbetering Y in de vorm van 3 soorten
behandelingen bij 30 patiënten met een bepaalde ziekte.
Kernvraag: Zijn er statistisch significante verschillen in
gezondheidsverbetering tussen de drie soorten behandelingen?
ANOVA-tabel met 1 factor: 1 variabele op basis waarvan je groepen
kunt indelen
De F-waarde als ‘test-statistic’
Statistisch significante verschillen? ‘Test-statistic’ nodig
F = variantie tussen groepen (between) / variantie binnen groepen
(within)
ANOVA-tabel is een heel handig hulpmiddel om variantieanalyse
gestructureerd aan te pakken en F te bepalen