Individual di*erences and personality 4th
edition
Micheal C Ashton
,1.1.1 Meetniveaus
Een uitdaging in psychologische meting, in tegenstelling tot metingen van veel fysieke
kenmerken, is dat het moeilijk of zelfs onmogelijk is om iemands absolute hoeveelheid
van een psychologische eigenschap te meten. Bij fysieke metingen, zoals lengte of
gewicht, is het zinvol om te zeggen dat iemand 50% langer is dan iemand anders, of
twee keer zo zwaar als iemand anders, omdat metingen van lengte en gewicht beginnen
bij nul. Maar bij psychologische metingen is er mogelijk helemaal geen betekenisvol
nulpunt.
Bijvoorbeeld, een persoon kan een score van nul behalen op een intelligentietest, maar
het lijkt niet zinvol om te zeggen dat de persoon nul intelligentie heeft—vermoedelijk
zou hij of zij een hogere score dan nul behalen als de test gemakkelijker zou zijn.
Evenzo, als iemand een score van nul heeft op een vragenlijstschaal die
“onconventionaliteit” meet, kunnen we niet zeker zijn dat deze persoon werkelijk
helemaal geen onconventionaliteit heeft. (En eveneens, als iemand een score van
100% op deze onconventionaliteitsschaal zou hebben, zou dit niet noodzakelijk
betekenen dat hij of zij werkelijk het hoogst mogelijke niveau van onconventionaliteit
heeft.)
Omdat psychologische metingen meestal geen echt nulpunt hebben, zijn de
verhoudingen tussen metingen niet betekenisvol—we kunnen niet echt zeggen dat de
ene persoon “twee keer zo intelligent” is of “50% meer onconventioneel” dan een
andere persoon.
Maar er zijn nog steeds manieren waarop we de niveaus van psychologische kenmerken
van mensen op een betekenisvolle manier kunnen vergelijken. Eén manier is
eenvoudigweg mensen te rangschikken op basis van hun scores: we zouden de niveaus
van mensen op een eigenschap kunnen meten met welke methode dan ook, en
vervolgens hun posities ten opzichte van elkaar vastleggen, zoals 1e, 2e, 3e, …, 654e, …
. Het rangschikken van mensen op basis van hun scores is een verstandige benadering,
maar het heeft enkele tekortkomingen.
Een moeilijkheid is dat de verschillen (of intervallen) tussen de rangen niet altijd
betekenisvol zijn. Bijvoorbeeld, de persoon met het hoogste niveau van een eigenschap
in een bepaalde steekproef kan slechts iets hoger zijn dan de persoon met het op één
na hoogste niveau, maar de persoon die op de tweede plaats staat kan ver, ver voor
liggen op de persoon op de derde plaats. Dit betekent dat rangen minder geschikt zijn
voor het berekenen van statistieken op basis van onze metingen. Bijvoorbeeld, wanneer
we het gemiddelde niveau van een eigenschap willen berekenen, is onze berekening
alleen betekenisvol als de verschillen tussen de getallen altijd hetzelfde betekenen.
Dus de getallen die door rangen worden gegeven zijn niet zo bruikbaar als we zouden
willen.
,Bij het meten van kenmerken van mensen zouden psychologen daarom graag scores
verkrijgen die betekenisvolle verschillen tussen hen hebben (ook al hoeven de
verhoudingen niet betekenisvol te zijn). Bijvoorbeeld, als we proberen de eigenschap
assertiviteit te meten, zouden we er zeker van willen zijn dat een score van 60 werkelijk
een niveau van assertiviteit betekent dat halverwege ligt tussen de niveaus die worden
aangegeven door een 50 en een 70.
Merk op dat assertiviteit niet echt wordt gemeten in bepaalde “eenheden”, en dat het
niet uitmaakt of de gemiddelde score 60, of 360, of –60, of wat dan ook is. Het
belangrijkste—voor het vergelijken van mensen en voor het berekenen van
gemiddelden—is simpelweg dat gelijke verschillen, of intervallen, tussen scores
ongeveer gelijke verschillen in het niveau van de eigenschap vertegenwoordigen.
Bijvoorbeeld, wanneer psychologen intelligentie meten met een “IQ”-test, hopen zij dat
het verschil tussen een IQ van 110 en een IQ van 120 werkelijk dezelfde betekenis heeft
als het verschil tussen een IQ van 130 en een IQ van 140. (Merk opnieuw op dat een IQ
van 0 niet betekent dat iemand nul intelligentie heeft.)
Hoe weten psychologen of hun metingen voldoen aan de eis dat ze betekenisvolle
verschillen hebben? De methoden om dit te testen vallen buiten de reikwijdte van dit
leerboek, maar we kunnen hier zeggen dat de meeste goed ontworpen psychologische
metingen dicht genoeg bij dit ideaal komen om nuttig te zijn voor statistische analyse.
📘 1.1.2 Standaardscores
Eerder werd vermeld dat psychologische kenmerken niet worden gemeten in bepaalde
eenheden en dat het er niet toe doet hoe hoog of laag de scores op een eigenschap zijn,
zolang de verschillen tussen scores betekenisvol zijn. Maar verschillen in de getallen
die worden gebruikt om variabelen te meten kunnen moeilijkheden veroorzaken
wanneer we iemands scores over twee of meer eigenschappen willen vergelijken.
Bijvoorbeeld, stel dat Bob een IQ van 90 heeft (waar het gemiddelde IQ 100 is) en dat
Bob ook een score van 60 heeft op een “sociabiliteitsschaal” (die, laten we zeggen, een
gemiddelde score van 50 heeft). Op het eerste gezicht lijkt het alsof Bob’s IQ-score (90)
hoger is dan zijn sociabiliteitsscore (60), maar in feite zit Bob onder het gemiddelde op
IQ en boven het gemiddelde op sociabiliteit.
Daarom hebben we een manier nodig om scores op de ene schaal te relateren aan
scores op een andere schaal, zodat we niveaus van de ene eigenschap kunnen
vergelijken met niveaus van een andere, of om niveaus van dezelfde eigenschap te
vergelijken zoals gemeten met verschillende schalen.
Psychologen zijn in staat om betekenisvolle vergelijkingen te maken tussen
verschillende meetschalen door de oorspronkelijke of “ruwe” scores om te zetten in
standaardscores. De eerste stap bij het berekenen van een standaardscore is om de
, oorspronkelijke (“ruwe”) score van een individu op een bepaalde schaal te nemen, en
vervolgens het gemiddelde (dat wil zeggen, de gemiddelde score) af te trekken van de
personen die zijn gemeten.
Dit verschil tussen de score van het individu en de gemiddelde score vertelt ons of de
persoon boven het gemiddelde zit (als het verschil positief is) of onder het gemiddelde
(als het verschil negatief is).
Maar dit is niet de enige stap. Als we alleen het gemiddelde aftrekken van de score van
een individu, hebben we mogelijk nog steeds geen betekenisvol idee van hoe ver boven
of onder het gemiddelde die persoon zich bevindt. Dit komt doordat schalen die
psychologische kenmerken meten verschillen in hoe “verspreid” de scores van mensen
zijn.
Bijvoorbeeld, op een typische IQ-test ligt ongeveer twee derde van de mensen binnen
15 punten van het gemiddelde (dus tussen 85 en 115), en ongeveer 95% van de mensen
ligt binnen 30 punten van het gemiddelde (dus tussen 70 en 130). Dus iemand met een
IQ van 110 zit boven het gemiddelde, maar niet heel ver boven het gemiddelde.
Maar stel nu dat we een andere IQ-test hebben, opnieuw met een gemiddelde van 100,
maar waarbij de scores van mensen veel dichter bij elkaar liggen (bijvoorbeeld twee
derde van de mensen tussen 95 en 105, en 95% tussen 90 en 110). Op deze schaal zou
een score van 110 juist heel hoog zijn.
Dus hebben we een manier nodig om schalen te vergelijken die verschillende
hoeveelheden variabiliteit in scores hebben, naast verschillende gemiddelde scores.
Om dit te doen gebruiken psychologen een tweede stap, nadat ze eerst het gemiddelde
van de schaal hebben afgetrokken van de score van het individu op die schaal.
Vervolgens delen zij dit verschil door de standaarddeviatie, een getal dat aangeeft
hoeveel variatie er is tussen mensen op een variabele.
Voor veel psychologische kenmerken ligt ongeveer twee derde van de mensen binnen
één standaarddeviatie boven of onder het gemiddelde, en ongeveer 95% van de
mensen ligt binnen twee standaarddeviaties boven of onder het gemiddelde.
(Bijvoorbeeld, in de eerder genoemde typische IQ-test is de standaarddeviatie 15.)
Het resultaat van deze twee stappen—het vinden van het verschil tussen de score van
het individu en het gemiddelde, en vervolgens dit verschil delen door de variatie
(standaarddeviatie) van de scores—is dat er een universele of standaard manier
ontstaat om scores van mensen op een bepaalde eigenschap uit te drukken, ongeacht
de oorspronkelijke verdeling van scores op die eigenschap.
Deze scores, bekend als standaardscores (of z-scores), hebben twee speciale
eigenschappen:
Ten eerste is de gemiddelde score op een standaardscore-schaal exact nul,