Leerdoelen:
- De gedachte achter statistische toetsen kunnen uitleggen
- Een T-toets voor een gemiddelde kunnen uitvoeren
- Uit kunnen leggen wat een one way design is
- De drie experimentele (basis)designs kunnen uitleggen
- Kunnen uitleggen wat het verschil is tussen subjectvariabelen en experimentele
variabelen
- Het eerste deel van de toetsboom kunnen gebruiken
Opheldering van de termen:
Populatie → Parameters (μ, σ)μ, σ))
Steekproef → Statistieken (x̄, , s)
Proefpersonen → waarden
Terugblik OP1:
De steekproevenverdeling is een wiskundig gegeven. Het is de verdeling van de
gemiddelden van alle mogelijke steekproeven met grootte n. Het is een normaalverdeling en
het gemiddelde van de verdeling is het populatiegemiddelde. De standaarddeviatie is de
standaarddeviatie van de meetwaarden, gedeeld door de wortel van de steekproefgrootte.
Van elke steekproef kun je een Z-waarde uitrekenen. In praktisch onderzoek werkt dat
echter niet zo. De standaarddeviatie van de meetwaarden in de populatie zijn namelijk niet
bekend. In plaats van de standaarddeviatie in de populatie kan wel gebruik gemaakt worden
van de standaarddeviatie in de steekproef. Hier komt een student-verdeling (t-verdeling) uit,
die net niet normaal verdeeld is.
Er zijn veel verschillende soorten t-verdelingen. Het is een soort familie van verdelingen. De
verdeling hangt af van de grootte van de steekproef, ook wel vrijheidsgraden genoemd.
Vrijheidsgraden zijn in dit geval de steekproefgrootte - 1.
Met een betrouwbaarheidsinterval wordt een schatting gegeven van een range waartussen
het echte populatiegemiddelde ligt. Het populatiegemiddelde valt met C% zekerheid in dit
interval. De formule hiervoor is: beste schatting van μ (= x̄, ) +/- de foutenmarge. Hoe groter
de t, hoe breder de interval en dus hoe meer kans dat het populatiegemiddelde binnen het
betrouwbaarheidsinterval ligt.
Hypothesen toetsen is een soort gedachte experiment. Er worden twee hypothesen
opgesteld, H0 en Ha. Er wordt bewijs gezocht voor Ha. Hoe kleiner de kans op het vinden van
het steekproefgemiddelde, hoe groter het bewijs tegen H0. Dit is een one-sample T-toets.
Een T-toets uitvoeren:
Bereken de T-waarde van je steekproef. Met de T-waarde kun je in de tabel de P-waarde
opzoeken. Dit is de kans op het vinden van het steekproefgemiddelde. Hoe kleiner die kans,
hoe meer bewijs tegen H0 en voor Ha. De P-waarde heet ook wel de overschrijdingskans.
Het is direct gelinkt aan de specifieke hypothesen die je hebt opgesteld.
Belangrijk: bij 2-zijdig toetsen vermenigvuldig je de P-waarde met 2.
Beslissing: is de overschrijdingskans (μ, σ)p) kleiner dan het significantieniveau (μ, σ)⍺)?
Dan is de steekproef TE bijzonder om H0 nog te geloven. Dus: verwerp H0 en accepteer
Ha.
Toetsingsschema
, 1. Onderzoeksvraag (+ situatieschets)
2. Hypothesen (één- of tweezijdig)
3. Toetskeuze (μ, σ)asSumpties?) + significantieniveau ⍺
4. Berekening toetsstatistiek
5. Aflezen p-waarde in één van de tabellen
6. Beslissing (vergelijk p met ⍺)
7. Inhoudelijke conclusie
Voorbeeld van een toets:
1. Wijkt de gemiddelde populatiescore op de test af van 537?
2. H0: μ = 537
Ha: μ ≠ 537 (μ, σ) → tweezijdig!))
3. Toetskeuze: one-sample t-toets, alpha = 0.05
4.
5. Tabel D →
- vrijheidsgraden bepalen
- waarden bepalen waartussen de gevonden t-waarde ligt
- bovenin kijken welke p-waarde bij de t-waarde hoort
- tweezijdig → p-waarde vermenigvuldigen
Dit kan ook met een online calculator, maar niet op het tentamen.
6. p < ⍺, dus Ha accepteren en H0 verwerpen
7. De gemiddelde populatiescore van de test is anders dan 537.
Populatieparameters op zich zijn vaak niet zo interessant. Er zijn meer interessante vragen
mogelijk, zoals het verschil in gemiddelden tussen groepen of het gemiddelde verschil
tussen variabelen. In OP2 gaan we kijken naar dit soort situaties, ook wel een one way
design genoemd. We gaan vooral kijken naar correlationeel en (quasi-)experimenteel
onderzoek.
De drie gouden regels van onderzoek:
1. Manipuleer ten minste één variabele
2. Zorg voor vergelijkbare groepen
3. Houd andere variabelen strikt gelijk
Een design is een one way design als er minstens twee condities (of levels) zijn waarvan er
één een onafhankelijke variabele is. Het hoeft niet zo te zijn dat er maar twee condities zijn,
maar het is wel zaak dat er maar één onafhankelijke variabele is.
,Er zijn drie experimentele basisdesigns
1. Randomized groups design
2. Matched subjects design
- Proefpersonen in de steekproef worden in groepjes verdeeld volgens een
subject variabele (bijv. leeftijd) die mogelijk relevant is voor het experiment.
De individuen worden vervolgens random verdeeld over de condities.
Proefpersonen uit dezelfde categorie worden met elkaar vergeleken. Zo wordt
het effect van een niet interessante, maar wel invloedrijke, variabele uit het
experiment gehaald.
3. Repeated measures design
Dit lijken dezelfde proefpersonen, maar zijn dit in feite niet. Na conditie I zijn deze
mensen net iets anders dan ze voor conditie I waren. Bij conditie II zijn het dus net
iets andere personen. Dit kan worden gecontroleerd met een techniek die
counterbalancing of cross-over heet. Dit is een combinatie van het randomized
groups design en het repeated measures design. Hierbij wordt de volgorde van de
condities gemanipuleerd. Dit is een two way design, omdat conditie en volgorde
allebei onafhankelijke variabelen zijn.
Soms wordt gebruik gemaakt van een pre- en een post-design. Dit houdt in dat er een
voormeting wordt gedaan, daarna de interventie wordt uitgevoerd en na afloop nog een
nameting wordt uitgevoerd. Dit kan op elk van de drie designs worden toegepast.
Voor veel designs zijn er specifieke toetsen beschikbaar. Een belangrijke vraag is: wanneer
moet je welke statistische toets doen? Hiervoor zijn zogenaamde ‘toetsbomen’ gemaakt, die
je begeleiden in de keuze.
College 2 T-toetsen
Leerdoelen:
- Hypothesen voor de verschillende t-toetsen kunnen opschrijven
- Kunnen uitleggen wat de relatie tussen een gepaarde t-toets en een one-sample t-
toets is
, - De theoretische gedachte achter een independent samples t-toets kunnen uitleggen
- Met de hand en in SPSS een t-toets voor afhankelijke en onafhankelijke
steekproeven kunnen uitvoeren en de bijbehorende output kunnen interpreteren
Probleemstelling: hoe kun je aannemelijk maken op grond van een steekproef dat er een
verschil is tussen twee populatiegemiddelden?
Twee antwoorden:
- Het verschil moet in ieder geval ook te zien zijn in de data.
- Laat zien dat de kans op het verschil in steekproefgemiddelden onwaarschijnlijk is,
als de populatiegemiddelden niet verschillen (dus: wat is de p-waarde?).
Voorbeeldvraag: is er een verschil tussen de populatiegemiddelden voor en na een
behandeling?
Het gaat hierbij om het verschil tussen twee metingen bij dezelfde
proefpersoon (of gematched of anderszins gekoppeld). Dus: of het
gemiddelde verschil tussen voor- en nameting afwijkt van 0. Dit is
beantwoordbaar met een one-sample t-test.
Een t-toets voor afhankelijke groepen is eigenlijk gewoon een one-sample t-toets op
verschilscores. Er zijn verschillende benamingen.
Hoe doe je een t-toets voor afhankelijke metingen?
- Bereken het steekproefgemiddelde van de verschilscores.
- Kan x̄, d redelijkerwijs gevonden worden als het
gemiddelde verschil in de populatie 0 zou zijn?
- Hoe bijzonder is deze t? p-waarde?
→ Tabel D, n-1 vrijheidsgraden
- Stel hypothesen op: Noot: in MMC wordt d weggelaten
- H0: μd = 0
- Ha: μd ≠ 0
- Bereken toetsstatistiek
- Beslissing: als p < ⍺, dan is het verschil significant
Betrouwbaarheidsintervallen voor het verschil in populatiegemiddelden werken hetzelfde als
voor een normale one-sample t-test. Dus: beste schatting ± foutenmarge.
De beste schatting voor het verschil in populatiegemiddelden is het steekproefgemiddelde
van de verschilscores. De foutenmarge is de standaardfout van de verschilscores
vermenigvuldigd met de kritieke t-grenswaarde (t*):