In dit thema leer je hoe je een statistische analyse kunt uitvoeren passend bij experimenten waarin twee
onafhankelijke groepen worden vergeleken. Hiervoor gebruik je de onafhankelijke t-toets. De t-toets
vormt de meest basale analysetechniek bij experimenten.
Studietaak 2.1 – T-toets (herhaling)
Hoofdstuk 23 T-toetsen en Cohen’s d
23.1 Een verschil tussen twee gemiddelden
Het hoofdstuk gaat over het vergelijken van twee gemiddelden. Meestal betreft dit een dichotome
variabele (bijvoorbeeld experimentele vs. controlegroep) en een continue afhankelijke variabele. Als de
groepsgemiddelden verschillen, kunnen we iemands score beter voorspellen als we weten tot welke
groep hij of zij behoort. Zijn de gemiddelden gelijk, dan biedt de groepsindeling geen voorspellende
waarde.
Ter illustratie wordt de Palmer Penguins dataset gebruikt, bijvoorbeeld voor het voorspellen van
snavellengte bij mannelijke en vrouwelijke pinguïns. Het verschil tussen de groepsgemiddelden heeft een
standaardfout, omdat het gebaseerd is op een steekproevenverdeling van alle mogelijke verschillen.
23.2 De steekproevenverdeling en het betrouwbaarheidsinterval voor het verschil
tussen gemiddelden
Het verschil tussen twee groepsgemiddelden volgt een t-verdeling met vrijheidsgraden gelijk aan de
steekproefomvang minus twee. Omdat een enkel steekproefverschil weinig zegt over de populatie,
gebruiken we een betrouwbaarheidsinterval (BI) om het waarschijnlijke bereik van het werkelijke verschil
aan te geven:
𝑩𝒆𝒕𝒓𝒐𝒖𝒘𝒃𝒂𝒂𝒓𝒉𝒆𝒊𝒅𝒔𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍 = 𝒔𝒕𝒆𝒆𝒌𝒑𝒓𝒐𝒆𝒇𝒘𝒂𝒂𝒓𝒅𝒆 ± 𝒃𝒓𝒆𝒆𝒅𝒕𝒆 − 𝒊𝒏𝒅𝒆𝒙 × 𝒔𝒕𝒂𝒏𝒅𝒂𝒂𝒓𝒅𝒇𝒐𝒖𝒕
1
, Voorbeeld:
De steekproefwaarde is het verschil tussen twee gemiddelden. Het verschil in snavellengte tussen
mannelijke (45,85 mm) en vrouwelijke (42,1 mm) pinguïns is 3,76 mm, met een standaardfout (wordt
gegeven door software) van 0,56. Voor een 95%-BI met een kritieke t-waarde (=breedte-index, wordt ook
gegeven) van 1,96 loopt het interval van 2,65 tot 4,86 mm, wat aangeeft dat mannetjes waarschijnlijk
langere snavels hebben.
𝑩𝒆𝒕𝒓𝒐𝒖𝒘𝒃𝒂𝒂𝒓𝒉𝒆𝒊𝒅𝒔𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍 = 𝟑. 𝟕𝟔 ± 𝟏. 𝟗𝟔 × 𝟎. 𝟓𝟔
Het BI hangt af van de meeteenheid; bij cm zou het interval 0,27–0,49 cm zijn. Het feit dat het BI
afhankelijk is van de schaal waarop de continue variabelen gemeten zijn, heeft voor- en nadelen:
• Voordeel = Het verschil in groepsgemiddelde wordt uitgedrukt in een concrete eenheid, in dit
geval mm (of cm), dat is vrij gemakkelijk te interpreteren.
• Nadeel = moeilijk om te bepalen hoe relevant dit verschil is. En de sterkte van dit verband is niet
te vergelijken met verschillen uit andere studies, tenzij in die studies exact dezelfde
meetinstrumenten gebruikt zijn.
Om verschillen schaalonafhankelijk te maken en vergelijkbaar tussen studies, gebruikt men Cohen’s d
als maat voor het effect.
23.3 Cohen’s d
Cohen’s d is een maat voor het verschil tussen twee groepsgemiddelden, gecorrigeerd voor de
standaarddeviatie. Door het verschil tussen de gemiddelden te delen door de standaarddeviatie ontstaat
een schaalonafhankelijke effectmaat.
De berekening lijkt op die van een z-score: bij een z-score wordt het verschil tussen een datapunt en het
gemiddelde gedeeld door de standaarddeviatie; bij Cohen’s d wordt het verschil tussen twee
gemiddelden gedeeld door de standaarddeviatie van de afhankelijke variabele.
̅
𝒙𝒊 − 𝒙 ̅𝟏 − 𝒚
𝒚 ̅𝟐
𝒛= 𝑪𝒐𝒉𝒆𝒏′ 𝒔 𝒅 =
𝒔𝒅𝒙 𝒔𝒅𝒚
Cohen’s d drukt het verschil dus uit in standaarddeviaties. Een d van 0,50 betekent dat de gemiddelden
een halve standaarddeviatie uit elkaar liggen; een d van 0,80 betekent dat ze 0,8 standaarddeviatie
verschillen.
23.3.1 Steekproevenverdeling van Cohen’s d
Cohen’s d heeft een eigen
steekproevenverdeling en
standaardfout.
Omdat een gevonden waarde van d
slechts één mogelijke uitkomst uit
die verdeling is, zegt de
puntschatting op zichzelf weinig;
daarom is het belangrijk om een
betrouwbaarheidsinterval te
berekenen om uitspraken over de
populatie te doen.
2