College Clips week 1:
Statistische onzekerheid = onzekerheid dat de conclusie gebaseerd kan zijn op een
toevalstreffer.
Bivariate analyse → gaat over 2 variabelen
CBS → op basis van populatie data, dus er is geen onzekerheid of de steekproef
generaliseerbaar is voor de populatie, want iedereen binnen de groep is onderzocht.
Stappen:
1. nulhypothese
2. toetsstatistiek berekenen (score standaardiseren)
3. kritieke waarden berekenen
4. beslissing
→ nulhypothese verwerpen = significant verschil
Overzicht t toetsen:
- one-sample t-test → steekproefgemiddelde toetsen aan vaste waarde
- paired sample t-test → herhaalde metingen van dezelfde steekproef (voor en
nameting)
- independent samples t-test → t-toets voor twee onafhankelijke steekproeven
1. beide steekproeven uit dezelfde populatie trekken
- experimentele groep en controlegroep (at random gekozen)
2. beide steekproeven uit verschillende populaties trekken
T-toets voor onafhankelijke steekproeven:
- gebruik je als je wilt toetsen of de gemiddelden van twee afzonderlijke groepen aan
elkaar gelijk zijn. (H0)
- voorwaarden:
- groepen zijn aselect en onafhankelijk van elkaar getrokken.
- groepen hoeven niet even groot te zijn
Stap 1:
- H0: U1 = U2 (populatiegemiddelden zijn gelijk)
H1: U1 =/ U2 (populatiegemiddelden zijn niet gelijk)
Stap 2:
, - toetsstatistiek:
- formule hangt af van varianties:
- zijn ze gelijk → pooled
- df = N1 + N2 - 2
- zijn ze niet gelijk → conservatieve benadering
- df = N1 -1 en N2 -1 → kleinste is df
Effectgrootte (d) = hoe groter het verschil tussen de steekproefgemiddelden is t.o.v. 0, hoe
groter het effect is.
→ geeft indicatie van het praktische belang
- 0.25 = klein
- 0.50 = middelmatig
- >1 = groot
f-toets en levene’s test voor equality of variance → toetsen of de populaties varianties gelijk
zijn. (toetsen van assumptie)
, f toets voorbeeld:
1.
H0: pop.var1 = pop.var2
H1: pop.var1 =/ pop.var2
2. toetsstatistiek: F = steekproefvariantie1 / steekproefvariantie2
- vrijheidsgraden apart voor noemer en teller berekenen (n-1)
- grootste steekproefvariantie komt in de teller
- f waarde kan nooit lager zijn dan 0
- alle waarden liggen rondom 1
3. kritieke waarde zoek je op in tabel E
- df1 = n1 - 1 (df in de teller)
- df2 = n2 - 1 (df in de noemer)
Bij independent t-test → variabelen waartussen je onderscheid maakt → groepen
(man/vrouw) moeten altijd van nominaal niveau zijn.
De variabelen die je bekijkt, moeten altijd van interval of ratio niveau zijn.
sneller significant verschil als de varianties verschillen
f-verdeling altijd .05 en tweezijdig, dus in tabel E kijken naar .025
Week 2:
--> Spooled = Wortel S^2 pooled
Bij lineaire regressie:
- is het mogelijk om het effect van x op y te bepalen
- is het een voorwaarde dat de populatie variantie van y gelijk is bij elke x (eis van
homoscedasticiteit)
4 assumpties lineaire regressie:
1. de steekproef bestaat uit onafhankelijke waarnemingen (bij voor en nameting bijv.
niet het geval, want de respondenten zijn hetzelfde bij beide waarnemingen, dus
afhankelijk)
2. er is sprake van een lineair model → lineair verband tussen de afhankelijke en
onafhankelijke variabele
3. homoscedasticiteit → de variantie van de residuen is gelijk voor alle mogelijke
waarden van de onafhankelijke variabele