Mogelijke manieren om meer dan twee groepen te vergelijken
(In deze situatie wordt ervan uitgegaan dat men drie groepen wil vergelijken.)
Onafhankelijke t-toetsen voor twee steekproeven.
Men vergelijkt groep 1 met groep 2, groep 1 met groep 3 en groep 2 met groep 3 in een
onafhankelijke t-toets. Nadelen van deze methode zijn:
De gepoolde variantieschatter (s2p) is gebaseerd op de twee steekproeven betrokken in de
hypothese. Hierdoor is voor elke t-toets de gepoolde variantieschatter anders, waardoor er
tegenstrijdige resultaten mogelijk zijn. Daarnaast is de gepoolde variantieschatter
betrouwbaarder/zuiverder als deze is gebaseerd op meerdere varianties (van elke groep).
De ‘totale’/overall type 1 fout () over alle uitgevoerde toetsen zal groter zijn dan de per
toets. Er geldt: maximale totale type1 fout=aantal paarsgewijze vergelijkingen∗per toets. In
deze situatie zou dat 3 * 5% = 15% zijn.
Onafhankelijke t-toetsen voor twee steekproeven rekening houdend met de totale type 1 fout ().
Men vergelijkt groep 1 met groep 2, groep 1 met groep 3 en groep 2 met groep 3 in een
onafhankelijke t-toets. Men zorgt er daarbij voor dat de totale type 1 fout () niet groter kan
worden dan vastgelegde . Dit doet men door een correctie toe te passen op iedere afzonderlijke
toets: per toets=totale type 1 fout /aantal paarsgewijze vergelijkingen. In deze situatie zou dat 5% / 3
= 1,67%. Men kan ook de gevonden p-waarden na toetsing corrigeren door:
gevonden p natoetsing∗aantal paarsgewijze vergelijkingen en deze vergelijken met de vastgelegde
. Nadelen van deze methode zijn:
De uitgevoerde toetsen worden conservatiever. Dit betekent dat de kritieke waarde om de
nulhypothese te verwerpen hoger wordt. Hierdoor wordt de nulhypothese pas verworpen
bij een grotere toetsingsgrootheid. De toets is daardoor minder gevoelig voor kleinere
verschillen.
De gepoolde variantieschatter (s2p) is gebaseerd op de twee steekproeven betrokken in de
hypothese. Hierdoor is voor elke t-toets de gepoolde variantieschatter anders, waardoor er
tegenstrijdige resultaten mogelijk zijn. Daarnaast is de gepoolde variantieschatter
betrouwbaarder/zuiverder als deze is gebaseerd op meerdere varianties (van elke groep).
De power/onderscheidingsvermogen van de toets wordt kleiner, doordat de type 2 fout ()
vergroot wordt: er is een grotere kans dat de nulhypothese behouden blijft, terwijl deze niet
waar is.
ANOVA = Variantie-analyse.
Voordelen van deze methode zijn:
De ‘totale’/overall type 1 fout () wordt onder controle gehouden.
Er wordt gebruik gemaakt van een gepoolde variantieschatter die gebaseerd is op de
varianties van de deelnemende groepen.
1-weg ANOVA
De 1-weg variantie-analyse wordt gebruikt wanneer er sprake is van een continue uitkomstvariabele en
men één factor wil vergelijken tussen meer dan twee groepen. Om ANOVA te mogen gebruiken moet
worden aangenomen dat:
De waarnemingen in de steekproeven zijn onafhankelijk van elkaar.
Dit is niet mogelijk om te checken, want dit hoort bij de proefopzet.
De populatie varianties zijn gelijk/homogeen.
Dit is belangrijk, omdat de F-toets gebaseerd is op de varianties.
1
, Check: de steekproefvarianties zijn ongeveer gelijk (boxplot, histogram, standaarddeviaties
vergelijken). ANOVA is hier minder robuust tegen.
De waarnemingen in de populatie zijn bij benadering normaal verdeeld/De residuen zijn normaal
verdeeld.
Check: de waarnemingen in de steekproef kunnen uit een normale verdeling komen (boxplot,
histogram, Q-Q-plot). ANOVA is hier robuust tegen als de steekproef groot is.
Toetsingsgrootheid: F
De toetsingsgrootheid voor 1-weg ANOVA is:
MSG
F=
MS E
F volgt een F-verdeling met k-1 (teller), n-k (noemer) vrijheidsgraden.
Deze toetsingsgrootheid deelt de variantie tussen de gemiddelden van de groepen door de variantie
binnen groepen:
Als de variantie tussen de gemiddelden van de groepen groter is dan de variantie binnen de
groepen, dan krijgt F een hogere waarde.
Als de variantie tussen binnen de groepen groter is dan de variantie tussen de gemiddelden van de
groepen, dan krijgt F een lagere waarde.
In deze situatie kan er minder goed onderscheid worden gemaakt tussen de gemiddelden van
groepen.
Er zijn twee mogelijkheden wat betreft de variantie tussen de gemiddelden:
Als het gemiddelde van alle groepen hetzelfde is, dan is de variantie
tussen de gemiddelden gelijk aan 0. Dit betekent dat het gemiddelde
van alle individuele groepen gelijk is aan het overall gemiddelde.
Als het gemiddelde van alle groepen niet hetzelfde is, dan is er
variantie tussen de gemiddelden. Dit betekent dat het gemiddelde van
alle individuele groepen niet gelijk is aan het overall gemiddelde.
H0 en H1
In eerste instantie wordt er een paraplutoets gedaan. Deze kan alleen
tweezijdig getoetst worden. Hiervoor worden de volgende hypotheses
opgesteld:
H0: 1 = 2 = 3 = ….
Er is geen verschil in gemiddelden tussen de groepen.
H1 .
Het gemiddelde van ten minste één groep wijkt af van de gemiddelden van de andere groepen.
Formules 1-weg ANOVA
Elke groep heeft een groepsgemiddelde. Het gemiddelde van alle groepsgemiddelde vormt het overall
gemiddelde.
De afwijking van een waarneming t.o.v. het overall gemiddelde (Y ij −Ý ) (SST). ( onverklaarbaar onder
nulhypothese) kan worden verklaard in twee termen:
Afwijking van het groepsgemiddelde t.o.v. het overall gemiddelde: Ý i−Ý (SSG). Verklaarbaar
onder alternatieve hypothese.
2