Weet dat ik naast deze samenvatting ook gebruik heb gemaakt van de antwoordmodellen van de
oefeningen. Als je dit document begrijpt evenals de antwoordmodellen van de oefeningen dan is het goed
te doen. Veel studenten ervaren dit als een relatief lastig vak wat het ook is; de eerste paar weken had ik
namelijk de veronderstelling dat ik vrij zeker wist een onvoldoende voor dit vak te halen, maar niet
getreurd veel studenten ervoeren hetzelfde en vaak pas in week vier begon alles geleidelijk bij eenieder te
landen. Belangrijk bij dit vak is dat je alles goed bijhoudt (hoorcolleges, vragencolleges, werkgroepen,
oefeningen/sommen, assignments/praktijkopdrachten, spss-opdrachten etc.).
Laatste tip: er worden véél vragen gesteld vanuit de klassieke test theorie (ken al de
implicaties, lees assumpties, hiervan goed!). Dit tentamen is niet vergelijkbaar met een statistiektentamen
(1.3 en 2.2) ruim twee derde van het tentamen zal bestaan uit theorie vragen. De focus ligt dus veel meer
op het begrip van alles omtrent de psychometrie in plaats van de statistische berekeningen. Vaak is het
wel zo dat je psychometrische kennis nodig hebt voor statistische analyses en andersom, oftewel weten
hoe je bijvoorbeeld formules moet herschrijven en wat deze herschrijvingen betekenen voor de
uitkomstmaten.
, 2
HC1: Psychometrie, een introductie [2.5]
Joran Jongerling & Mariska Barendse
➔ Samenvatting HS 1 + 2: meten is moeilijk en een getal aan iets geven, betekent niet dat het ergens opslaat (= kern).
Hoofdstuk 1: De relevantie van psychologische metingen
Doel: kennen van de meest belangrijke uitdagingen van psychologische metingen
Uitdagingen voor metingen -> 1 tentamenvraag hierover (rest IRRELEVANT van HS 1 en 2); houdt dit
document chronologisch bij, FOCUS UITEINDELIJK – dus tijdens het leren – OP DE LEERDOELEN (DIT
MOET JE KUNNEN BEANWOORDEN!)
- Identificeren en vastleggen van menselijke psychologische attributen in 1 nummer.
o Bvb. intelligentie in 1 getal.
- Participant reactiviteit (1): bewustzijn test -> invloed op test.
o Bvb. depressief worden door een depressieve vragenlijst.
o Demand characteristics: doel van studie uitvogelen -> gedrag veranderen t.b.v.
onderzoek.
o Social desirability: goede indruk maken op testleider.
o Malingering: slechte indruk maken op onderzoeker.
- Objectiviteit (expectation en bias effect) (2)
o Persoon die de test leidt -> kan invloed hebben op de test.
o Dus verwachting v.d. onderzoeker is van invloed op hoe je data interpreteert.
- Composiet score (3)
o Meerdere scores -> bvb. op een depressie test -> t.b.v. beter beeld. I.p.v. 1 simpele test.
o Vraag: is ELK ITEM even goed? Om bij te dragen aan de SUM score.
- Score sensitiviteit (4): niet elke meting gevoelig voor verschildetectie.
o Bvb. zijn meters sensitief genoeg om iets te zeggen over lengte? -> Nee. CM nodig.
- Gebrek aan bewustzijn van psychometrische informatie (5).
o Geen bewustzijn over hoe moeilijk meten is.
➔ Voorbeeld rechtsboven: beste manier op hechting te meten of niet?
Hoofdstuk 2: Scaling
Samengevat: scaling (= numerieke waarde aan psychologische attribuut geven)
Hoofdstuk 3: Individuele verschillen en correlaties
De natuur van variabiliteit
- Twee type variabiliteit.
o Interindividuele verschillen (tussen mensen).
o Intraindividuele verschillen (binnen mensen) -> bvb. longitudinaal onderzoek.
Variabiliteit en distributie met een variabele
- Centrale tendentie: wat is typisch / meest representatieve
score in de verdeling? (Mean, mediaan en modus.)
o i = 1 loopt door tot 100 bvb.
o Dus bvb. 7813 -> 78 score en 13 participantnummer.
- Variabiliteit (zie variantie en standaardafwijking).
➔ Merk op: N-1 gebeurt ALLEEN bij inferentiële statistieken. N-1 of louter N verschilt ook per blok.
Grootte (interpretatie) v.d. variantie afhankelijk van
- Mate waarin scores in een verdeling verschillen.
- De metriek (= schaal, bvb. cm vs. meters) v.d. scores in een verdeling.
Factoren die in acht moeten worden genomen bij het interpreteren v.d. variantie
- Variantie kan NIET kleiner zijn dan 0.
- GEEN simpele interpretatie mogelijk over of s2 groot of klein is.
- Context/vergelijking (bvb. schaal die is gebruikt) is nodig om de grootte te interpreteren.
- Belangrijk voor effecten in andere waarden (correlatie, betrouwbaarheid).
, 3
Variabiliteit voor twee variabelen
- Covxx = sx2 -> WANT als je X met X vermenigvuldigt ben je eigenlijk aan
het kwadrateren (wat je bij een variantie uitrekent).
- Covariantie: lineaire associatie tussen 2 variabelen.
o Op het tentamen / N aanhouden ≠ N-1.
o Maak ALTIJD eerst een bivirate plot om te zien of er überhaupt
een lineaire associatie is.
o Alleen informatie over de richting v.d. associatie.
- Correlatie (= gestandaardiseerde covariantie).
o Bvb. Pearson’s correlatiecoëfficiënt kan ALLEEN tussen -1 en
+1 zitten.
o Informatie over de richting v.d. associatie EN de omvang.
➔ ALLE bovenstaande formule nuttig bij symmetrische verdelingen.
➔ Verschil in schaal (bvb. cm en meter) maakt voor covariantie uit, maar voor de correlatie NIET.
Variabiliteit tussen meerdere variabelen
- Lineaire associatie tussen meerdere variabelen.
- Variantie-covariantie matrix (s2)
o Associatie tussen p variabelen in een symmetrische p * p matrix.
▪ Symmetrisch (2 bij 2 of 4 bij 4 bvb.).
o Variantie op de diagonalen.
o Op rij i en kolom j de covariantie tussen xi en xj.
- Correlatie matrix (gestandaardiseerde covariantie matrix)
o Diagonalen gelijk aan 1.
o Op rij i en kolom j de correlatie tussen xi en xj.
Toelichting covariantie matrix
- ELKE variabele heeft een rij EN een kolom (1).
o Dus bij 2 variabelen is je matrix (2 * 2) en bij 4 variabelen (4 * 4).
- Varianties zijn op de diagonalen (2).
o Diagonalen gelijk aan 1.
o DUS van linksboven naar rechtsonder.
o Betrekking op 1 variabel.
- Covarianties zijn op de off-diagonalen (dus NIET op de diagonalen) (3).
o Gelijk aan de gestandaardiseerde relatie tussen variabelen.
o Betrekking op 2 variabelen.
o Deze waardes zijn GELIJK (zie tabel 3.3a).
- Covarianties zijn symmetrisch cxy = cyx (4).
o Dus ONDER de diagonaal is gelijk aan BOVEN de diagonaal (zie 3.3a).
Compositie score
- Item responses worden gecombineerd (in 1 getal).
o Dus meerdere meetinstrumenten meten
bijvoorbeeld blijdschap.
▪ Kan OOK 1 vragenlijst zijn (die
meerdere vragen bevat -> en dus
meerdere SCORES op een schaal).
o Item = meetinstrument.
- Reflecteert een psychologische attribuut.
, 4
- Assumeert uni-dimensionale items.
o Bijvoorbeeld 12 meetinstrumenten die dezelfde schaal gebruiken (= uni-dimensionaal)
om ‘hetzelfde ding’ te meten. Bvb. blijdschap.
- Variantie van compositie scores.
o NIET gelijk aan variantie van item scores omdat items gebruikelijk gecorreleerd zijn.
▪ MAAR als de correlatie van v.d. bvb. 2 items 0 is, dan is de variantie v.d.
compositie (dus v.d. 2 varianties in 1 getal) gelijk aan de 2 individuele varianties
bij elkaar opgeteld.
o HIEROMTRENT kan je ook niet alle losse items bij elkaar optellen en kwadrateren,
vanwege potentiële correlaties.
o DUS wat je doet is variantie X + variantie Y + TWEE KEER cov xy (= cov xy, cov yx).
- Compositie score
o K = maximaal aantal items (bvb. 12 als je 12 metingen gebruikt om iets te zeggen over de
variabele blijdschap bij individuen).
o J = geeft item nummer aan.
Variantie en covariantie van compositiescores
- Variantie compositie score = opsommen alle cellen v.d. variantie covariantie matrix.
- X = blijdschap -> twee items meten dit (Y1 en Y2).
- Variantie v.d. compositie (van 2 scores) -> optellen van (Y1 + Y2)2 / N.
o Er zijn uitgebreidere beschrijvingen hiervoor (zie hierboven de slide).
- Je hebt 2 keer de variantie en 2 keer de covariantie.
o Zelfde als eerdere slide (zie pagina 3, rechtsonder).
o Simpel gezegd dus: variantie compositie score = variantie Y1 + variantie Y2 +
covariantie XY + covariantie YX.
Covariantie van twee compositiescores
- Bvb. totaalscores self-esteem en totaalscore depressie vragenlijst.
- Bovenstaande slide illustreert dit a.d.h.v. 2 items op 2 instrumenten.
o Covarianties tussen die items is de SUM v.d. covarianties.
, 5
Variabiliteit voor binaire items (betrekking op een variabele)
- Binair: 2 mogelijkheden (wel of niet; successen vs.
niet-successen.).
- Rechtsboven
o Rijen: participanten.
o X = 1 variabele.
o Y = 1 variabele.
o Je kunt of NIET (= 0) of WEL (= 1) op X of Y
hebben gescoord.
▪ Successen versus niet-successen.
o Hierbij bereken je de proportie (= px of py)!
o Voor px deel je bvb. 1 door 3 = 1/3 = 0.33.
Associatie tussen twee binaire items
- Phi-coëfficiënt voor binaire items -> beter te interpreteren dan de covariantie voor een
associatie tussen twee binaire items.
o Gebaseerd op cel-proporties en marginale proporties (summeer proporties van rijen en
kolommen).
o 2009: gelijk aan de tetracorricale correlatiecoëfficiënt (= achter deze binaire
variabelen zit een continue variabelen).
Interpreteren van de test scores
- Normaalverdeling is belangrijk in psychometrie.
o Kijk naar de afwijking v.d. mean in een
referentieverdeling.
o Kijk naar de afwijking relatief aan de andere scores
in een referentieverdeling.
- Bvb. blijdschapvragenlijst -> score 25 -> is dit hoog of laag?
- Dichtheidskromme -> NIET ZO BELANGRIJK, maar meer dat je weet dat het bestaat.
- Een standaard normaal verdeling is wanneer de x-scores, z-scores zijn.
o Mean is dan 0.
o Sd is dan 1.
- 95% v.d. scores valt tussen -1.96 en 1.96 interval en 99% v.d. scores valt tussen -
2.58 en +2.58 interval.
Transformatie van testscores
- Hoe kunnen we een testscore interpreteren (bvb. 18).
o Is dit hoog of laag?
o Is dit ver bovengemiddeld?
- Ruwe testscores worden vaak getransformeerd om individuele scores
interpreteerbaar te maken.
o Vergelijk de scores van dezelfde steekproef.
o Vergelijk met een referentiegroep (bvb. middels een normtabel).
Transformeren naar z-scores (gestandaardiseerde scores) (vergelijking met steekproef)
- Trek het gemiddelde van alle test scores af.
, 6
- Deel de gecentreerde scores door de standaardafwijking.
- De mean is gelijk aan 0 en de standaardafwijking aan 1.
- Z-scores zijn normaal gedistribueerd als de ruwe scores normaal zijn gedistribueerd.
o ANDERS kan je deze test NIET gebruiken.
- Wanneer x normaal is verdeeld. Dan p (Zx < 5) kan worden benaderd door een cumulatieve
distributie functie.
o Je kunt nu kijken hoeveel % hoger/lager scoort dan een persoon.
➔ Van individuele score naar z-score.
Converteren VAN gestandaardiseerde scores (= T-scores)
- Kan ALLEEN als je a priori een mean en spreiding hebt.
- Makkelijker om te interpreteren
o Transformeer ruwe scores naar z-scores.
o Herschaal en hermove de z-scores.
- T=Z(snew)+X̅ new
- Bijvoorbeeld
o IQ scores hebben een mean van 100 en een standaardafwijking van 15.
o Iemand heeft Z=2 op een want-to-be intelligence test. De IQ score is dan.
▪ IQ = 2 * 15 + 100 = 130.
➔ Van z-score naar T-score.
Percentiel ranks
- = Percentage van mensen met een gegeven score of lager.
o GEEFT AAN of een persoon HOGER of LAGER in een
PERCENTIEL valt.
- Order raw scores (rangschikken): percentiel scores herschalen
scores van 0 naar 100.
- Opties (om achter de percentiel rank te komen)
o Wanneer een verdeling normaal is: gebruik de z score om
de p (= percentiel) te berekenen v.d. standaard normaal
verdeling.
o Wanneer de verdeling NIET normaal is (bvb. bij kleine
steekproef): gebruik de frequentie tabel en de
contiuïteitscorrectie -> percentiel rank = px=((Fx−.5f)/n) * 100.
▪ Je CORRIGEERT hier je GEKKE distributie.
▪ F staat voor frequentie.
▪ 5 staat voor de helft van je frequentie van een specifieke getal (bvb.3).
▪ Je kijkt naar -> hoeveel mensen scoren lager DAN een bepaald getal.
Voorbeeld continuïteitscorrectie
- Wat is de percentielscore van iemand met een score van 3, oftewel hoeveel mensen scoren
LAGER dan 3.
o 5 mensen (= 1) lager dan 3 en 12 mensen (= 2) lager dan 3.
o Maar wat met de 18 mensen (= 3)? 3 loopt van 2.5 tot 3.49. Hieromtrent pakken we de
helft -> helft perfect onder 3.00 en helft perfect boven 3.00. Dus we krijgen 9.
o De berekening wordt dan 5 + 14 + 18 – 9 = 26* = 26.
Rationale achter de continuïteitscorrectie
- Op een continue schaal hebben mensen met een score van 2.5 tot 3.499 allemaal een score van 3.
- De percentiel rank is het percentage mensen met een score van 3.0000 of lager.
- Helft v.d. frequentie van mensen die 3 hebben gescoord kunnen worden verondersteld tussen de
3.00 en 3.5 te scoren.
- Hieromtrent halen we de helft v.d. frequentie af v.d. cumulatieve frequentie.
, 7
Genormaliseerde scores
- Een steekproef is NIET mooi normaal verdeeld vergeleken met
de normaalverdeling v.d. populatie door vertekeningen.
o De percentielscores (verkregen via bvb. de
continuïteitscorrectie) kan je gebruiken om een
verdeling normaal te maken.
- Drie stappen procedure
1. Bereken de percentiel ranks.
a. Je ziet in de afbeelding hiernaast bvb. 5 mensen
met een 0 en 22 mensen met een 2.
b. De percentiel ranks bereken je o.b.v. de
continuïteitscorrectie.
2. Converteer de percentiel ranks naar gestandaardiseerde
scores (= z-scores).
3. Converteert de gestandaardiseerde scores naar scores met een gegeven metriek
(bijvoorbeeld en T).
- Afbeelding hiernaast
o Linkercurve TRANSFORMEER je naar de rechtercurve OMDAT die meer NORMAAL is.
▪ Dit kan ALLEEN als de verdeling in de populatie normaal is.
Aanvulling normaliseren van scores (vanuit vragencollege)
- Bij het normaliseren blijven de relatieve posities van individuele scores in een
verdeling gelijk.
o Bvb. participant 2 heeft 2.5% v.d. scoren boven zich en 97.5% v.d.
scores boven zich in een scheve distributie -> heeft dit OOK in een
normale distributie.
o De relatieve afstand tussen de participanten is WEL veranderd.
▪ NIET allemaal in dezelfde richting. Sommigen naar links en
sommigen naar rechts.
▪ NIET allemaal dezelfde afstand. Sommigen meer/minder
naar links/rechts.
- DUS wat is er gebeurt?
o Eerst de percentiel scores berekend.
o Vervolgens in een normaalverdeling bepalen WAAR de
relatieve positie hetzelfde blijft.
- Standaardiseren naar z-scores resulteert NIET altijd in
genormaliseerde verdelingen.
o Zorgt ALLEEN voor een mean van 0 of sd van 1.
o De vorm BLIJFT hetzelfde!
o Geldt OOK voor T-scores als X NIET NORMAAL is, dan is z
NIET NORMAAL en T ook NIET NORMAAL!
, 8
Relevante informatie uit uitgewerkte voorbeeld HS3
Gestandaardiseerde scores
a. Scores transformeren in T-scores met een mean van 50 en SD van 20. Wat ligt binnen 95% CI?
a. 2x SD links en 2x SD rechts -> 10 en 90. Exact 10.8 en 89.2 (gebaseerd op 1.96 aan beide
kanten = 95% CI).
b. Meerdere vragen
a. Scheefheid (= scheefheid wordt gedeeld door zijn SEs). 2 en -2 zijn z-scores. DUS
hierboven significant.
i. Score groter dan -2 -> negatief scheef.
ii. Score groter dan 2 -> positief scheef.
b. Kurtosis (= kurtosis wordt gedeeld door zijn SEs). 2 en -2 zijn z-scores. DUS
hierboven significant.
i. Kurtosis waarde groter dan -2 -> piek v.d. verdeling is te plat.
ii. Kurtosis waarde groter dan 2 -> piek v.d. verdeling is te scherp.
c. In een histogram en Q-Q plot kan je normaliteit waarnemen (bvb. afwijkingen v.d. lijn in
de Q-Q plot duidt op non-normaliteit, oftewel scheefheid).
d. Als de kolmogorov-smirnov test significant is, indiceert dit een afwijking v.d.
normaal verdeling.
i. = ERG conservatief.
c. Meerderde dingen
a. Z-score: standaardscore met een mean van 0 en SD van 1. Wat wordt berekend door de
ruwe scores, de mean v.d. ruwe scores en de SD v.d. ruwe scores.
b. T-score: geconventeerde standaardscore om verkregen waarde beter begrijpbaar te
maken. Z-score wordt geconventeerd in een nieuwe standaarscore (T-score) door de Z-
score te vermenigvuldigen met de SD v.d. nieuwe score en de nieuwe mean toe te
voegen.
d. X
e. Scores kunnen verschillen als je bij de originele data uitgaat van een normaalverdeling hoeft dit
NIET te betekenen dat er ook een normaal verdeling is bij percentielen.
Percentiel ranks
Om norm scores te maken kan een test constructeur gebruikmaken van percentielranks en p-waarden
die afstammen v.d. standaard normaalverdeling.
a. Percentiel ranks en p-waarden indiceren allebei het percentage mensen met een gelijke score
of lager.
a. Percentielen -> niet per se uitgaan van een normaalverdeling.
i. Geen informatie over de populatie en/of niet zeker of de populatie normaal
verdeeld is -> percentiel ranks gebruiken.
b. P-waarden -> uitgaan van een normaalverdeling.
i. DUS als de steekproef normaal oogt gedistribueerd en het waarschijnlijk is dat
deze steekproef is getrokken uit een normaal verdeelde populatie dan kan je p-
waarden gebruiken.
ii. WANNEER dit wordt verondersteld -> wordt p geprefereerd aangezien dit
minder beïnvloed wordt door steekproeffluctuaties.
b. X
c. Wat je bij SPSS doet is percentiel scores berekenen en p-waarden om de verschillen te bekijken
van scores om bvb. te stellen of je verdeling in je data bvb. normaal is of niet.
a. DUS hoe normaler je verdeling -> hoe dichter de percentiel scores liggen bij de p-
waarden.
d. Het is gevaarlijk p-waarden te gebruiken als je NIET zeker weet of je een normaalverdeling hebt.
Dit leidt namelijk tot percentages die TEVEEL verschillen v.d. percentages bij een NON-
normaalverdeling.
Genormaliseerde scores
A. Genormaliseerde transformatie gebeurt in 3 stappen.
1. Berekenen v.d. percentiel ranks.
2. Converteren v.d. percentiel ranks naar gestandaardiseerde scores.