College samenvatting Testtheorie 2021/2022
College 1
Geschiedenis en kenmerken van tests
Overzicht v/h vak:
Historische ontwikkeling van het testen
Test:
o Definitie
o Kenmerken
o Toepassingen
o Indelingen
o Onderscheidingen
o Begrippen
Testen: meten van eigenschappen van mensen, verschillende vormen en afnames (tests,
proeven, vragenlijsten)
Nut:
Onderscheid maken
Vergelijking maken
Beschrijven
Maatschappelijk:
o Diagnoses stellen
o Schoolvorderingen
o Voorspellen/plaatsen/toelating en selectie
Onderzoek
Onderzoek: groepen vergelijken, relatie tussen variabelen
Testconstructie (Vb: motivatie, intelligentie) en kwaliteitsbepaling:
Wat willen we meten? Waarom?
Operationalisatie (vragen, opgaven, uitspraken)
Relatie delen-geheel
Kwaliteit (doel, construct, betrouwbare meting)
Historische ontwikkeling:
Periode tot Binet-Simon-test Begin WO2 -
WO1-WO2
Binet-Simon-test – WO1 heden
Periode tot Binet-Simon-test
Psychiatrie
Experimentele psychologie
Genetica (Galton)
o Wenselijkheid individuele verschillen
o Systematisering van technieken (generalisatie conclusies)
o Afwijkingen van het gemiddelde (statistische testen)
Aanloop tot ontwikkeling testtheorie, weinig complexe vaardigheden
,Binet-Simon-test – WO1
Binet-Simon (1904)
o Complexe opgaven
o Empirisch onderzoek moeilijkheidsgraad berekenen
o Werken met een totaalscore ( begrip mentale leeftijd)
Terman: Stanford-Binet
o Formuleren van standaardinstructies
o Normen gebaseerd op representatieve steekproef
[Mentale leeftijd / kalender leeftijd] x 100 = IQ
Alleen individu
Geen valideringsonderzoek
o Samenhang tests met latere prestaties
o Selecteren/wegen nog niet van toepassing
WO1 – WO2
Door nood aan selectie van personeel voor leger WO testen in stroomversnelling
Na WO1:
o EU: individuele diagnostiek, later collectief
o VS: collectief testen, migrantenprobleem non-verbale testen
Engeland:
o Tussenpositie
o Aandacht voor objectief evalueren van schoolprestaties (MC-test)
Gebruik test ging voor theorie
Thurstone (1931):
o Focus op betrouwbaarheid en criterium validiteit testgedrag buiten de
testsituatie voorspellen
Begin WO2 – heden
Aantal testen neemt toe
Aandacht voor methodologie
Educational Testing Service (VS, 1947)
o Evalueren v/h onderwijs
o Fundamenteel psychometrisch onderzoek
Introductie computer
Test: Een systematisch onderzoek van gedrag met behulp van speciaal geselecteerde vragen
of opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk van de
onderzochte in vergelijking met anderen
Kenmerken test:
Efficiëntie
Standaardisatie
Normering
Objectiviteit
o Resultaat van onderzoek is onafhankelijk van degene die de gegevens
verzamelt of uitwerkt
Betrouwbaarheid
Validiteit
, Schaal Wat? Voorbeeld
Nominaal Ongeordend Man - Vrouw Mate van overeenstemming:
categorieën
Ordinaal Geordende Mild – matig –
categorieën maar ernstig
ongelijke
afstanden
Interval Geordende Graden Celsius
categorieën en
gelijke afstanden
Betrouwbaarheid:
Zelfde conclusie bij meerdere metingen
Een test is betrouwbaar wanneer het testresultaat niet afhangt van het moment waarop
getest is of de testleider
Validiteit:
Meten wat je wil meten
Overzicht/indelingen van tests:
Verschillende mogelijkheden
o Soort testgedrag (Vb. prestatieniveau, gedragswijze)
o Instructie en afneming (Vb. individueel – groep)
o Testvragen (Vb. open – MC)
Indeling naar testgedrag:
Prestatieniveau
o Maximale prestatie, G/F – norm
o Totaalscore
o (Meestal) intelligentie, cognitive, capaciteit, kennis
Gedragswijze
o Hoe iemand iets doet, reactie
o Persoonlijkheidstrek/voorkeuren/attitudes
College 1
Geschiedenis en kenmerken van tests
Overzicht v/h vak:
Historische ontwikkeling van het testen
Test:
o Definitie
o Kenmerken
o Toepassingen
o Indelingen
o Onderscheidingen
o Begrippen
Testen: meten van eigenschappen van mensen, verschillende vormen en afnames (tests,
proeven, vragenlijsten)
Nut:
Onderscheid maken
Vergelijking maken
Beschrijven
Maatschappelijk:
o Diagnoses stellen
o Schoolvorderingen
o Voorspellen/plaatsen/toelating en selectie
Onderzoek
Onderzoek: groepen vergelijken, relatie tussen variabelen
Testconstructie (Vb: motivatie, intelligentie) en kwaliteitsbepaling:
Wat willen we meten? Waarom?
Operationalisatie (vragen, opgaven, uitspraken)
Relatie delen-geheel
Kwaliteit (doel, construct, betrouwbare meting)
Historische ontwikkeling:
Periode tot Binet-Simon-test Begin WO2 -
WO1-WO2
Binet-Simon-test – WO1 heden
Periode tot Binet-Simon-test
Psychiatrie
Experimentele psychologie
Genetica (Galton)
o Wenselijkheid individuele verschillen
o Systematisering van technieken (generalisatie conclusies)
o Afwijkingen van het gemiddelde (statistische testen)
Aanloop tot ontwikkeling testtheorie, weinig complexe vaardigheden
,Binet-Simon-test – WO1
Binet-Simon (1904)
o Complexe opgaven
o Empirisch onderzoek moeilijkheidsgraad berekenen
o Werken met een totaalscore ( begrip mentale leeftijd)
Terman: Stanford-Binet
o Formuleren van standaardinstructies
o Normen gebaseerd op representatieve steekproef
[Mentale leeftijd / kalender leeftijd] x 100 = IQ
Alleen individu
Geen valideringsonderzoek
o Samenhang tests met latere prestaties
o Selecteren/wegen nog niet van toepassing
WO1 – WO2
Door nood aan selectie van personeel voor leger WO testen in stroomversnelling
Na WO1:
o EU: individuele diagnostiek, later collectief
o VS: collectief testen, migrantenprobleem non-verbale testen
Engeland:
o Tussenpositie
o Aandacht voor objectief evalueren van schoolprestaties (MC-test)
Gebruik test ging voor theorie
Thurstone (1931):
o Focus op betrouwbaarheid en criterium validiteit testgedrag buiten de
testsituatie voorspellen
Begin WO2 – heden
Aantal testen neemt toe
Aandacht voor methodologie
Educational Testing Service (VS, 1947)
o Evalueren v/h onderwijs
o Fundamenteel psychometrisch onderzoek
Introductie computer
Test: Een systematisch onderzoek van gedrag met behulp van speciaal geselecteerde vragen
of opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk van de
onderzochte in vergelijking met anderen
Kenmerken test:
Efficiëntie
Standaardisatie
Normering
Objectiviteit
o Resultaat van onderzoek is onafhankelijk van degene die de gegevens
verzamelt of uitwerkt
Betrouwbaarheid
Validiteit
, Schaal Wat? Voorbeeld
Nominaal Ongeordend Man - Vrouw Mate van overeenstemming:
categorieën
Ordinaal Geordende Mild – matig –
categorieën maar ernstig
ongelijke
afstanden
Interval Geordende Graden Celsius
categorieën en
gelijke afstanden
Betrouwbaarheid:
Zelfde conclusie bij meerdere metingen
Een test is betrouwbaar wanneer het testresultaat niet afhangt van het moment waarop
getest is of de testleider
Validiteit:
Meten wat je wil meten
Overzicht/indelingen van tests:
Verschillende mogelijkheden
o Soort testgedrag (Vb. prestatieniveau, gedragswijze)
o Instructie en afneming (Vb. individueel – groep)
o Testvragen (Vb. open – MC)
Indeling naar testgedrag:
Prestatieniveau
o Maximale prestatie, G/F – norm
o Totaalscore
o (Meestal) intelligentie, cognitive, capaciteit, kennis
Gedragswijze
o Hoe iemand iets doet, reactie
o Persoonlijkheidstrek/voorkeuren/attitudes