- Week 7: Op dinsdag Q&A
- Dinsdag: Theorie. Vrijdag: Tentamenvoorbereiding.
- Examen: 30 meerkeuzevragen. 10 vragen over Statistiek 1 & 2. 20 vragen over Statistiek 3.
- 1 vraag van wekelijkse formatieve examen komt in het tentamen.
College 1:
Definitie van statistiek: De wetenschap van het verzamelen, organiseren en interpreteren van
numerieke feiten, die we data noemen.
Belangrijke punten voor het toepassen van statistiek:
- Een steekproef selecteren uit een populatie.
- Bepalen of een steekproef representatief is.
- Beschrijvende of inferentiële statistieken.
- Meetlevels (NOIR) en types van variabelen (categorisch/kwantitatief)
- Selecteren van de correcte statistische analyse.
- Experimenteel versus non-experimenteel onderzoeksdesign.
Het belang van goed empirisch onderzoek (statistiek) voor sociale en organisatorische psychologie
= Meningen en Wetenschappelijk bewijs ligt soms ver uit elkaar.
Het belang van goed empirisch onderzoek (statistiek) voor klinische psychologie:
= Regressie naar het gemiddelde. Het is een statistisch feit dat extreme scores neigen om minder
extreem te worden na het her-testen. Dit fenomeen staat bekend als regressie naar het
gemiddelde. Dit kan therapeuten en cliënten in de maling nemen en laten geloven dat nutteloze
behandeling effectief is.
Beschrijvende statistiek: Vat steekproef of populatie data samen met nummers, tabellen en
grafieken.
Inferentiële statistiek: Maakt voorspellingen over populatie parameters, gebaseerd op een
(random) steekproef van data.
Onderzoek doen door middel van data: observatie van karakteristieken.
- Populatie: de totale set van participanten, die relevant is voor de onderzoeksvraag. (Bijv:
Populatie parameter: gemiddelde tijd van zelfstudie per week bij alle studenten).
- Steekproef: Een subset van de populatie over wie de data verzameld wordt. (Bijv:
Steekproef statistiek: Gemiddelde tijd van zelfstudie per week bij random geselecteerde
steekproef van 800 studenten).
Goede data zijn belangrijk om de onderzoeksvraag te
beantwoorden:
- Betrouwbaarheid (Precisie) + Validiteit (Bias)
Beschrijvende statistiek:
- Variabele: Meetkarakteristiek die kan verschillen per onderwerp.
o Types: Gedrag-, stimulus-, onderwerp-, psychologische variabele.
o Meetschalen (NOIR):
▪ Categorisch/kwalitatief: Nominaal (zonder volgorde; oogkleur, geslacht) /
Ordinaal: met volgorde, eens/neutraal/oneens)
, ▪ Kwantitatief/numeriek: Interval (Gelijke afstand tussen waarden; graden
celcius)/Ratio (Gelijke afstand en ware nul punt).
o Bereik:
▪ Discreet: Meetunit die
ondeelbaar is (aantal
broers/zussen)
▪ Continue: Oneindig deelbare
meetunits (lichaamshoogte).
- 3 belangrijke dimensies:
o Centrale neiging: Typische observatie. Meet: gemiddelde, modus, mediaan.
o Spreiding: Variatie in observaties. Meet: Standaarddeviatie, variantie, interkwartiele
spreiding.
o Positie: Relatieve positie in de observatie(s). Geeft informatie over de relatieve
positie van observaties; percentiel, kwartiel, etc.
Inferentiële statistiek:
- Doel: Betrouwbare en valide statements over de populatie op basis van een steekproef:
Steekproefstatistiek zou niet moeten verschillen van de populatie parameter.
- Problemen:
o Steekproef error: Natuurlijke steekproefvariatie.
o Steekproef bias: Selectief steekproef trekken.
o Respons bias: Onjuist antwoord.
o Non-respons bias: Selectieve participatie.
- Er is een belangrijk verschil tussen problemen die te maken hebben met betrouwbaarheid
(error) en validiteit (bias).
- Oplossing: Een random steekproef benadering van voldoende grote die data genereert voor
iedereen die benaderd is, met correcte antwoorden op alle items voor alle onderwerpen.
Dimensies van distributies:
Populatie distributie: Percentage studenten dat aangeeft behoefte te
hebben aan extra ondersteuning voor wiskunde. (u).
Steekproef data distributie: Percentage studenten in de steekproef dat
aangeeft extra behoefte te hebben aan ondersteuning voor wiskunde
(n=1000).
Steekproef distributie: De waarschijnlijke verdeling van de steekproef
statistieken. Te interpreteren als resultaat van herhaald een steekproef
nemen van grootte n.
- Standaarddeviatie van 0.015.
- Standaard error =
SLIDE 28 nog overnemen
Normaalverdeling → Z-statistiek
- Steekproefdistributie voor proportie wanneer H0 geldt.
- En wanneer de populatie standaarddeviatie bekend is.
Student T distributie → T-statistiek
, - Steekproefverdeling voor gemiddelde wanneer H0 geldt en wanneer de standaarddeviatie
onbekend is.
- Steekproef verdeling voor regressie coëfficiënt wanneer H0 geldt.
Chi Square distributie → χ2-statistiek
- Steekproef verdeling voor kwadraat verdelingen (in frequenties) van categorische
variabelen wanneer H0 geldt.
Fisher’s distributie → F-statistiek
- Steekproef verdeling voor ANOVA-omnibus test van gemiddelde wanneer H0 geldt.
Steekproef verdeling en hypothese testen:
- Significantie-test hypothese-test: Methode waarmee je bepaalt, gebaseerd op een
steekproef, hoe sterk het bewijs tegen een bepaalde hypothese is en vervolgens mee
bepaalt of je de hypothese verwerpt.
- 5 stappen van een hypothese-test:
o Assumpties definiëren
o Hypothese opzetten
o Test-statistiek berekenen *
o P-waarde bepalen.
o Conclusie trekken.
Type 1 – error: De kans hierop wordt bepaald door het gekozen
significantie level (α). Vals positief.
Type 2 – error: De kans hierop wordt bepaald door effectgrootte,
steekproefgrootte en variantie binnen de steekproef. Vals negatief.
Hoe kleiner de gekozen Type 1 fout, hoe groter het type 2 fout.
3 voorbeelden van hypothese testen:
1) Vergelijking van 2 groepen met 1 kwantitatieve uitkomstvariabele (T-test).
2) Vergelijking van 2 of meer groepen met 1 kwantitatieve uitkomstvariabele (ANOVA).
3) Bepalen van de relatie tussen 2 kwantitatieve variabelen (regressieanalyse).
Vergelijking van 2 groepen: T-test
- Vergelijking tussen twee steekproeven:
o Afhankelijke steekproeven:
▪ Man en vrouw (bijvoorbeeld: tijd gespendeerd aan huishoudelijke
activiteiten, binnen huwelijk).
▪ Herhaalde metingen: Dezelfde persoon op twee verschillende punten in tijd.
, o Onafhankelijke steekproeven:
▪ Man en vrouw in random geselecteerde steekproef.
▪ Democraten en republikeinen
- Nulhypothese: H0: u1=u2
o Assumpties van een onafhankelijke t-test:
▪ Afhankelijke variabele is kwantitatief en normaal verdeeld (interval/ratio-
level)
▪ Gelijke varianties voor beide groepen:
▪ Onafhankelijke observaties (binnen en tussen groepen)
Vergelijking van 2 of meer groepen: ANOVA
- Analyse Of Variantie.
- One-way between subjects ANOVA:
o Elke participant valt alleen in 1 groep (bv. 4 types van stresssituaties)
o Voor elke participant is er 1 observatie (bv. zelf gerapporteerde angst)
- Groepen worden bepaald door de levels/categorieën van de factor: In dit geval het aantal
verschillende stresssituaties.
- Nulhypothese: H0: u1=u2=…=Uk
o Assumpties voor ANOVA omnibus test:
▪ Afhankelijke variabele is kwantitatief en normaal verdeeld (interval/ratio-
level).
▪ Gelijke varianties voor alle K groepen:
▪ ‘Onafhankelijke observaties’ (Binnen en tussen groepen).
ANOVA test-statistiek: F-Ratio:
- ANOVA:
o F= MSbg/MSwg → MS= mean square, bg= between groups, wg= within groups.
o Numerator/teller (MSbg) informatie over variantie in gemiddelden van between
groepen (M1, M2, …Mk) *
o Denominator/noemer (MSwg) informatie over variantie in
gemiddelden van within groepen.
- De F-test is een omnibus test (globale test): Is er een verschil tussen een of meer van de
gemiddelden?
o Het toont niet aan welke groepen verschillen!
- F-test significant? Twee manieren om verschillen tussen specifieke groepen te testen:
o Post Hoc (Na het feit, na datacollectie, exploratief) → Tukeys test.
o A priori (Vooraf gepland, confirmatief/bevestigend) → Contrasts, regressieanalyse.
*
Relatie tussen variabelen: naar bivariate statistiek:
- Univariate (1 variabele) statistiek:
o Meten van centrale neiging. o Betrouwbaarheidsinterval
o Meten van spreiding. gemiddelde/proportie.