TESTTHEORIE
Betrouwbaarheid en validiteit van schaalscores.
Model klassieke testtheorie
Opgaven Testtheorie oefenen wat er in een college wordt besproken.
Formuleblad staat bij assignments
In responsiecolleges komen bepaalde opgaven aan bod.
Practicum en eindopdracht SPSS – betrouwbaarheidsanalyse en factoranalyse komen hierin
aanbod. Verdere info volgt?
Beroepscode van NIP:
- Integer
- Respectvol
- Verantwoordelijk
- Deskundig
Je kan deze dingen meten. Betreft het abstracte concepten (theoretische concepten?)
Theoretisch concept → operationaliseren → meetinstrument → gestandaardiseerde afname →
testscore (puntschatting) → intervalschatting (ruimere schatting binnen welke grenzen
iemands werkelijke waarde zit).
Schatting van de betrouwbaarheid heb je nodig om de interval schatting te kunnen realisteren.
Theoretische concepten:
- Gender
- Lengte
- Rekenvaardigheid
- Presentatie-motivatie
- Integriteit
Operationalisatie: de beschrijving van handelingenoperaties die nodig zijn om de bedoelde
eigenschap te meten.
,Beoordeling integriteit
Vraag van de dag:
Voldoet Vera aan de integriteitseis voor de GZ-opleiding?
Procedure:
- Stel de grenswaarde voor integriteit is testscore 12.5.
- Neem integriteitstest bij Vera af.
- Vera scoort 11 punten op de integriteitstest.
- Vergelijk geobserveerde score met grenswaarde.
- Vera scoort lager dan de grenswaarde.
(Voorlopig) antwoord van de dag:
Nee, ze scoort lager dan 12,5.
Beslissing in onzekerheid, omdat het een puntschatting is. Er kunnen meerdere factoren
meespelen die zorgen dat haar integriteit niet goed naar voren komt (bijv. slecht
meetinstrument, Vera uit haar doen, etc.)
Model klassieke testtheorie
− Model voor testscores: X = T + E
− Toevallige meetfout
− Systematische meetfout
- Standaardmeetfout
, X staat voor de observatie (testscore). Twee invloeden die zorgen voor X.
T: de ware score, de echte mate van integriteit die Vera beschikt. Mate is bepalend hoe je
reageert op de vragen die gesteld worden. Ware score van respondent. Belangrijkste factor die
uiteindelijk een bepaalde testscore realiseerd. Zeer integer → hoog scoren, niet integer → laag
scoren. Je hoopt dat het zo werkt.
E: de toevallige meetfout. Bijv. omgeving, toestand respondent waardoor iemand net wat
hoger of lager scoort dan de ware score van die persoon. Invloeden kunnen overal liggen. De
toevallige fout moet je zo klein als mogelijk kunnen maken→ kan door gestandaardiseerde
tests te maken.
Vergelijking van eerste model. Error kan ook een minnetje zijn. Ofwel ten gunste ofwel te
nadele van iemands ware score. E negatief: iemand een lagere testscore. E positief: hoger dan
de ware score.
Invloeden: persoon, omgeving, test, testleider. Geen precieze indicatie van de echte score.
, Systematische meetfout: vb: moeilijke woorden in rekentoets: dan niet alleen
rekenvaardigheid meten maar ook rekenvaardigheid. Of sociale wenselijkheid op een test.
Toevallige invloeden = E = persoon, omgeving, test, testleider
Binnen ware score: 2 zaken: wat de test beoogt te meten & systematische meetfout (wat
systematisch ook een rol speelt maar niet beoogt te meten.
→betrouwbaarheid is een noodzakelijke, maar niet voldoende voorwaarde voor de validiteit
van testscores
Betrouwbaar is afwezigheid van een toevallige meetfout, valide ook afwezigheid toevallige
meetfout én systematische meetfout. Betekend dat een onbetrouwbare meting nooit valide kan
zijn. Valide meting is per definitie betrouwbaar.