Testtheorie en testgebruik
Hoorcollege 1
Opdracht: na college 4 (gaat over factoranalyse) opdracht maken zie hoorcollege slides.
Voldoende voor opdracht is voorwaarde voor deelname aan tentamen.
Deadline: 13 oktober 17.00 digitaal inleveren via nestor (iedere student levert zijn opdracht in, dus
in tweetallen op voorblad beide namen invullen maar beide inleveren op nestor).
Tentamen: 9 november 17.00 uur
Tentamenstof: H2 t/m H9, aanvullende factor analyse en inhoud hoorcolleges. Afleidingen van
formules zijn geen tentamenstof, op nestor staat document met relevante formules.
Op nestor komt een document met voorbeeldopgaven, vooral met rekenvragen waarmee je kunt
oefenen (opgaven uit het boek niet maken).
Algemene inleiding
Geschiedenis
McKeen Cattell deed onderzoek naar kwantificeren van individueel verschillen, want daar gaat het
over bij psychologische tests. Hij maakte de eerste stappen op de weg van het systematische
onderzoek van/naar individuele verschillen. In 1890 kwam voor het eerst het woord test voor in een
psychologisch blad.
Psychologische tests
Doel: uitspraak doen die een voorspelling, classificatie of beschrijving mogelijk maakt met
betrekking tot het onderzochte individu.
Psychologische tests meten psychologische eigenschappen
o Niet direct observeerbaar/meetbaar (zoals lengte).
Daarom construeren we indicatoren (items) die gedrag oproepen dat iets zegt over het te
meten construct
o Bijv. intelligentie, dat zou je ook kunnen doen om iemands lengte te meten.
Psychologische tests worden alleen afgenomen wanneer je geen goed beeld hebt van de
persoon, omdat je dat dus aan de buitenkant niet goed kan zien
Onthoud wel: een test is een hulpmiddel, dus oppassen voor het verabsoluteren van
testscores (de score zien als waarheid).
o Het is maar een testscore, en daar zitten ook fouten in. Het is maar een indicator.
o Scores zijn feilbaar.
o Bv. Bij een kind, als een kind de vraag niet snapt maar toch gewoon een antwoord
invult, is het dan waarheid? Nee.
Een psycholoog dient m.b.v. de test tot een oordeel te komen, op basis van combinatie van
verschillende waarnemingen
Dus geen blind testgebruik, dit is het gevaar met internettesten.
o Zelf het gevaar bij computer-based testen.
Tests worden zeer veel gebruikt.
Meten in sociale wetenschappen
, Intelligentie als construct
Het meetinstrument: de intelligentietest in combinatie met een meetmodel (hoe hoger de
score, hoe intelligenter).
Testscore: alle scores sommeren en delen door alle items.
Wat betekenen de metingen?
Criterium je stelt een bepaalde grens n.a.v. de scores
Normen scores vergelijken met een groep die voor jou belangrijk is, o.b.v.
gemiddelde/spreiding, normale verdeling, z-scores.
Opfrissen statistische begrippen
inhoud appendix wordt bekend verondersteld (achter in het boek; moet je kennen voor de
rest van het vak).
Notatie
o K = totaal aantal items in een test
o Items kennen indices g en h (of andere willekeurige letters, in het boek g en h. dit is
om items aan te duiden)
o Xg en Xh = scores op items (toevalsvariabelen). X is dus de score op item g en score
op item h
Dichotome items: twee antwoordmogelijkheden. Xg = 0,1
Polytome scores: vragen met meerdere antwoorden Xg = 0,….,m
Zodat aantal geordende categorieën is m + 1 (vijf
antwoordcategorieën omdat we altijd beginnen met 0)
M staat voor het aantal antwoordcategorieën plus 1.
o X = ruwe testscore, ook wel totaalscore
Ongewogen som van de k itemscores in de test
Antwoorden van de 10 items optellen en dan heb je de ruwe testscore.
Ruwe testscore = de som van de itemscores voor alle items van 1 tot en met
k (dus 10).
o Personen worden aangeduid met de letter i
N = aantal personen waarbij jij de test hebt afgenomen
We gaan uit van scores van n personen i = 1, ……, n
Dus 5 personen. I = 1, i = 2, i = 3, i = 4, i = 5, n
Xig = score persoon I op item g
Dus X24 = score van persoon twee op item 4
Xi = ruwe (test)score van persoon i
o Ja krijgt altijd score 1, nee krijgt altijd score 0.
Zie college slides
Spreiding
We veronderstellen individuele verschillen
Daarom is het belangrijk dat er spreiding is in de totaalscores op een test
o Hoe ver ligt een score van het gemiddelde van de verdeling?
Variantie
o Uitkomst in gekwadrateerde eenheden, daarom:
Werken we met de standaarddeviatie: de wortel uit de variantie.
Std algemene formule voor spreiding
N-weging voor spreiding van de scores in een specifieke groep (nog
algemener dan n-1 die we bij statistiek 1a en 1b hebben gehad).
Je kunt ook spreiding hebben op items (dichotome items)
, o Zie formule op college slide.
Samenhang: covariantie
Maat voor lineaire samenhang
o In hoeverre variabelen x en y samen variëren (of item g en h).
o Geeft de richting van het verband aan
o Niet de sterkte van het verband
o Positieve lineaire samenhang
Hoe hoger de numerieke intelligentie score, hoe hoger …
Hoe lager, hoe lager..
o Negatieve lineaire samenhang
X pos, Y neg
X neg, Y pos
o Geen lineaire samenhang
Covariantie gemiddelde product van de afwijkingsscores in de groep S(X,Y)
Afwijkingsscores hoever de score van een bepaalde persoon afwijkt van het gemiddelde in
de groep.
Variantie-covariantiematrix
Variantie staat in de diagonaal
Covariantie staat daarnaast
Lineaire combinaties
Een som van variabelen (al dan niet gewogen)
o Zoals de ruwe score
Lineaire combinaties spelen een belangrijke rol bij de betrouwbaarheid
o Het is daarbij belangrijk te weten hoe ….
Gemiddelde van een somvariabele
o Optelsom van het gemiddelde van item 1 + gemiddelde van item 2 opgeteld tot het k
aantal items per test.
Variantie van een somvariabele
o Som van de variantie van de variabelen plus de som van alle covarianties
Dus de som van alle elementen in de variantie-covariantiematrix
Dus elke covariantie wordt twee keer meegeteld.
Voorbeeldvraag 1: antwoord is 8.1 1,5 + 4,7 als varianties en 0.95 + 0.95 als covarianties 6,2 + 1,9
= 8.1
Lineaire combinatie en covariantie:
Dus, covariantie van twee somvariabelen = de som van de covarianties van de variabelen van
de twee sommen
Kenmerken van een test (H2)
Zes kenmerken van goede test t.o.v. voorwetenschappelijk oordeel:
Efficiëntie
o De test is alleen maar gericht op het meten van hypothetisch construct, zonder
andere storende factoren
Standaardisatie
Hoorcollege 1
Opdracht: na college 4 (gaat over factoranalyse) opdracht maken zie hoorcollege slides.
Voldoende voor opdracht is voorwaarde voor deelname aan tentamen.
Deadline: 13 oktober 17.00 digitaal inleveren via nestor (iedere student levert zijn opdracht in, dus
in tweetallen op voorblad beide namen invullen maar beide inleveren op nestor).
Tentamen: 9 november 17.00 uur
Tentamenstof: H2 t/m H9, aanvullende factor analyse en inhoud hoorcolleges. Afleidingen van
formules zijn geen tentamenstof, op nestor staat document met relevante formules.
Op nestor komt een document met voorbeeldopgaven, vooral met rekenvragen waarmee je kunt
oefenen (opgaven uit het boek niet maken).
Algemene inleiding
Geschiedenis
McKeen Cattell deed onderzoek naar kwantificeren van individueel verschillen, want daar gaat het
over bij psychologische tests. Hij maakte de eerste stappen op de weg van het systematische
onderzoek van/naar individuele verschillen. In 1890 kwam voor het eerst het woord test voor in een
psychologisch blad.
Psychologische tests
Doel: uitspraak doen die een voorspelling, classificatie of beschrijving mogelijk maakt met
betrekking tot het onderzochte individu.
Psychologische tests meten psychologische eigenschappen
o Niet direct observeerbaar/meetbaar (zoals lengte).
Daarom construeren we indicatoren (items) die gedrag oproepen dat iets zegt over het te
meten construct
o Bijv. intelligentie, dat zou je ook kunnen doen om iemands lengte te meten.
Psychologische tests worden alleen afgenomen wanneer je geen goed beeld hebt van de
persoon, omdat je dat dus aan de buitenkant niet goed kan zien
Onthoud wel: een test is een hulpmiddel, dus oppassen voor het verabsoluteren van
testscores (de score zien als waarheid).
o Het is maar een testscore, en daar zitten ook fouten in. Het is maar een indicator.
o Scores zijn feilbaar.
o Bv. Bij een kind, als een kind de vraag niet snapt maar toch gewoon een antwoord
invult, is het dan waarheid? Nee.
Een psycholoog dient m.b.v. de test tot een oordeel te komen, op basis van combinatie van
verschillende waarnemingen
Dus geen blind testgebruik, dit is het gevaar met internettesten.
o Zelf het gevaar bij computer-based testen.
Tests worden zeer veel gebruikt.
Meten in sociale wetenschappen
, Intelligentie als construct
Het meetinstrument: de intelligentietest in combinatie met een meetmodel (hoe hoger de
score, hoe intelligenter).
Testscore: alle scores sommeren en delen door alle items.
Wat betekenen de metingen?
Criterium je stelt een bepaalde grens n.a.v. de scores
Normen scores vergelijken met een groep die voor jou belangrijk is, o.b.v.
gemiddelde/spreiding, normale verdeling, z-scores.
Opfrissen statistische begrippen
inhoud appendix wordt bekend verondersteld (achter in het boek; moet je kennen voor de
rest van het vak).
Notatie
o K = totaal aantal items in een test
o Items kennen indices g en h (of andere willekeurige letters, in het boek g en h. dit is
om items aan te duiden)
o Xg en Xh = scores op items (toevalsvariabelen). X is dus de score op item g en score
op item h
Dichotome items: twee antwoordmogelijkheden. Xg = 0,1
Polytome scores: vragen met meerdere antwoorden Xg = 0,….,m
Zodat aantal geordende categorieën is m + 1 (vijf
antwoordcategorieën omdat we altijd beginnen met 0)
M staat voor het aantal antwoordcategorieën plus 1.
o X = ruwe testscore, ook wel totaalscore
Ongewogen som van de k itemscores in de test
Antwoorden van de 10 items optellen en dan heb je de ruwe testscore.
Ruwe testscore = de som van de itemscores voor alle items van 1 tot en met
k (dus 10).
o Personen worden aangeduid met de letter i
N = aantal personen waarbij jij de test hebt afgenomen
We gaan uit van scores van n personen i = 1, ……, n
Dus 5 personen. I = 1, i = 2, i = 3, i = 4, i = 5, n
Xig = score persoon I op item g
Dus X24 = score van persoon twee op item 4
Xi = ruwe (test)score van persoon i
o Ja krijgt altijd score 1, nee krijgt altijd score 0.
Zie college slides
Spreiding
We veronderstellen individuele verschillen
Daarom is het belangrijk dat er spreiding is in de totaalscores op een test
o Hoe ver ligt een score van het gemiddelde van de verdeling?
Variantie
o Uitkomst in gekwadrateerde eenheden, daarom:
Werken we met de standaarddeviatie: de wortel uit de variantie.
Std algemene formule voor spreiding
N-weging voor spreiding van de scores in een specifieke groep (nog
algemener dan n-1 die we bij statistiek 1a en 1b hebben gehad).
Je kunt ook spreiding hebben op items (dichotome items)
, o Zie formule op college slide.
Samenhang: covariantie
Maat voor lineaire samenhang
o In hoeverre variabelen x en y samen variëren (of item g en h).
o Geeft de richting van het verband aan
o Niet de sterkte van het verband
o Positieve lineaire samenhang
Hoe hoger de numerieke intelligentie score, hoe hoger …
Hoe lager, hoe lager..
o Negatieve lineaire samenhang
X pos, Y neg
X neg, Y pos
o Geen lineaire samenhang
Covariantie gemiddelde product van de afwijkingsscores in de groep S(X,Y)
Afwijkingsscores hoever de score van een bepaalde persoon afwijkt van het gemiddelde in
de groep.
Variantie-covariantiematrix
Variantie staat in de diagonaal
Covariantie staat daarnaast
Lineaire combinaties
Een som van variabelen (al dan niet gewogen)
o Zoals de ruwe score
Lineaire combinaties spelen een belangrijke rol bij de betrouwbaarheid
o Het is daarbij belangrijk te weten hoe ….
Gemiddelde van een somvariabele
o Optelsom van het gemiddelde van item 1 + gemiddelde van item 2 opgeteld tot het k
aantal items per test.
Variantie van een somvariabele
o Som van de variantie van de variabelen plus de som van alle covarianties
Dus de som van alle elementen in de variantie-covariantiematrix
Dus elke covariantie wordt twee keer meegeteld.
Voorbeeldvraag 1: antwoord is 8.1 1,5 + 4,7 als varianties en 0.95 + 0.95 als covarianties 6,2 + 1,9
= 8.1
Lineaire combinatie en covariantie:
Dus, covariantie van twee somvariabelen = de som van de covarianties van de variabelen van
de twee sommen
Kenmerken van een test (H2)
Zes kenmerken van goede test t.o.v. voorwetenschappelijk oordeel:
Efficiëntie
o De test is alleen maar gericht op het meten van hypothetisch construct, zonder
andere storende factoren
Standaardisatie