In dit thema leer je hoe je een statistische analyse kunt uitvoeren passend bij experimenten waarin twee of
meer onafhankelijke groepen worden vergeleken. Hiervoor gebruik je de one-way ANOVA (eenweg ANOVA).
Voorbeeld: bij het testen van de effectiviteit van een nieuw medicijn → één groep krijgt het nieuwe medicijn,
één groep krijgt een placebo en één groep krijgt het al bestaande medicijn. Bestaande klachten worden na
twee maanden vastgesteld. Zo kan je toetsen of het nieuwe medicijn beter is dan het placebo en of het beter
is dan wat er nu gebruikt wordt.
Studietaak 3.1 – Variantieanalyse (one-way ANOVA)
Hoofdstuk 24 Variantieanalyse
24.1 Inleiding
One-way ANOVA (variantieanalyse) is een uitbreiding van de onafhankelijke t-toets. Waar de t-toets twee
groepsgemiddelden vergelijkt, gebruik je one-way ANOVA om meer dan twee groepen met elkaar te
vergelijken. De t-toets is dus een speciaal geval van ANOVA met slechts twee groepen.
Bij one-way ANOVA is er:
• één predictorvariabele (categorisch; bepaalt de groepen)
• één afhankelijke variabele (numeriek)
Met de F-toets (die hoort bij ANOVA) wordt getoetst of de groepsgemiddelden van elkaar verschillen. De
nulhypothese stelt dat alle groepsgemiddelden gelijk zijn.
Een significante F-toets laat zien dat er minstens één verschil is tussen de groepen, maar niet welke groepen
precies verschillen. Daarom heet dit een omnibustoets.
Om te bepalen welke groepen van elkaar verschillen, gebruik je:
• post-hoc-toetsen (achteraf vergelijken)
• contrastanalyses (vooraf geplande vergelijkingen).
24.2 De logica achter ANOVA
ANOVA is een variant van de t- en z-toets, echter kunnen deze toetsen slechts 2 groepen met elkaar
vergelijken en kan ANOVA 2 of meer groepsgemiddelden vergelijken.
De z-waarde voor de z-toets wordt als volgt berekend:
̅− 𝝁
𝑿
𝒛=
𝟐
√𝝈
𝑵
𝑋̅ = gemiddelde van de steekproef, 𝜇 = het populatiegemiddelde, 𝜎 2 = variantie in de afhankelijke variabele en
N is de steekproefgrootte.
1
, De z-waarde standaardiseert het verschil tussen twee waarden door het te delen door de standaarddeviatie
(of standaardfout). Hierdoor wordt het verschil uitgedrukt in aantal standaarddeviaties.
Een z-waarde van 2 betekent dat twee gemiddelden twee standaarddeviaties van elkaar verschillen en hoort
ongeveer bij de bovenste 5% van de verdeling (vaak statistisch significant).
Formule van de t-toets vergelijkt twee steekproefgemiddelden (ipv populatieparameters)
̅̅̅̅
𝑿𝟏 − ̅̅̅̅
𝑿𝟐
𝒕=
𝒔𝟐 𝒔 𝟐
√ +
𝑵𝟏 𝑵𝟐
De t-toets werkt net als de z-toets door twee gemiddelden van elkaar af te trekken.
Als de nulhypothese klopt en de gemiddelden gelijk zijn, is het verschil 0 en dus ook de t-waarde 0.
Het verschil met de z-toets is dat bij de t-toets onder de streep niet de populatievariantie staat, maar een
schatting van de variantie uit de steekproeven van beide groepen.
Bij ANOVA worden de groepsgemiddelden als varianties behandeld. En wordt er in tegenstelling tot bij de t-
toets, bij ANOVA geen verschillende populaties vergeleken, maar is iedere groep eigenlijk een subgroep van
een hogere-orde-factor. Bij ANOVA worden subgroepgemiddelden uit een populatie vergeleken met het
globale populatiegemiddelde.
ANOVA toetst de homogeniteit van gemiddelden, met andere woorden of het mogelijk is om de
subgroepgemiddelden van een populatie simpelweg met één populatiegemiddelde uit te drukken, of dat dit
een te eenvoudig model is en dat een model waarin subgroepen verschillende gemiddelden hebben beter is.
Dit heeft als voordeel een eenvoudig te formuleren nulhypothese.
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = ⋯ = 𝜇𝑘
Voorbeeld:
Katten en honden worden vergeleken op verzorgingsgemak (schaal 1–10). Honden scoren gemiddeld 4,
katten 6 en het totaalgemiddelde is 5.
Hieronder twee manieren om het ruwe verschil tussen honden en katten uit te drukken (t-toets en ANOVA)
24.2.1 Verschil uitdrukken in een t-toets
Honden zijn een populatie met gemiddelde 𝜇 en een nog te schatten variantie 𝒔𝟐 . Hetzelfde geldt voor katten.
Beide populaties zijn normaal verdeeld.
Nulhypothese is 𝐻0 : 𝜇ℎ𝑜𝑛𝑑𝑒𝑛 = 𝜇𝑘𝑎𝑡𝑡𝑒𝑛
Alternatieve hypothese is 𝐻a : 𝜇ℎ𝑜𝑛𝑑𝑒𝑛 ≠ 𝜇𝑘𝑎𝑡𝑡𝑒𝑛 → er wordt tegen de nulhypothese getoetst, dus Ha heeft
geen waarde.
Honden en katten zijn twee populaties die alleen verschillen in hun modus (gemiddelde). Voor de t-toets
wordt het ruwe verschil, de variabiliteit, berekend als: 4 − 6 = −2
Katten zijn volgens de t-toets dus een populatie die 2 punten meer verzorgingsgemak bezitten dan honden.
24.2.2 Verschil uitdrukken in ANOVA
Dieren zijn een populatie met gemiddelde 𝜇 en een nog te schatten variantie 𝒔𝟐 . Honden en katten zijn ieder
een subgroep uit de populatie, met te schatten gemiddelde 𝑿̅̅̅̅ en een nog te schatten variantie 𝒔𝟐 . De
populatie dieren is normaal verdeeld.
Nulhypothese is 𝐻0 : 𝜇ℎ𝑜𝑛𝑑𝑒𝑛 = 𝜇𝑘𝑎𝑡𝑡𝑒𝑛
2