- Drenth & Sijtsma H1, H2 en H3
Week 1- College 1
Wat zijn testen eigenlijk?
- Meetinstrumenten voor het meten van eigenschappen of vaardigheden van mensen
of situaties.
- Tests, proeven, vragenlijsten, observatieformulieren etc.
- Verschillende vormen van afnames
Nut ervan: Meestal om onderscheid te maken, te vergelijken of een beschrijving te schetsen.
- Maatschappelijke functie: diagnoses stellen, leer-onderwijsproblemen vaststellen.
- Voorspellingen doen, plaatsing, toelating
Maar… In onderzoek:
1. Vergelijking tussen groepen
2. Relatie tussen variabelen (verbanden vinden)
> We gaan ervan uit dat de meting ook daadwerkelijk wat zegt over de persoon, en dat deze
meting betrouwbaar is, maar is dat ook zo?
Testtheorie is dan ook: de wetenschappelijke benadering van het ontwerpen en evalueren
van een test.
(Inhoud komt overeen met H1)
Ontwikkelen van test → testconstructie
1. Wat willen we meten en waarom?
2. Hoe kunnen we dit operationaliseren in vragen, opgaven en uitspraken? →
wat kunnen we iemand laten doen/lezen/beantwoorden?
3. Wat is de relatie tussen de delen en het geheel?
4. Wat is de kwaliteit van de test (doel, construct, betrouwbare meting).
Historie
- Oude China (2000 v. Chr)
- Oude Testament
Persoonlijkheidstest en Gedragstest
Oorspronkelijk werd de kwaliteit van een test meer op intuïtie of common-sense beoordeeld.
In de twintigste eeuw meer systematisch en met empirische fundering voor de test.
Periode tot verschijnen Binet-Simon-Test
3 stimulansen:
1. Opkomst Psychiatrie
- Onderscheiden van verschillende geestelijke afwijkingen
2. Experimentele psychologie
, - Gestandaardiseerde experimenten naar sensorische en motorische functies,
maar verschillen tussen mensen werden als storend ervaren (want alle
condities zijn hetzelfde, dus hoe kunnen jullie nou verschillend “scoren”).
3. Genetica
- Erfelijkheid van psychische eigenschappen. Juist individueel verschillen
belangrijk. Systematiseren van de technieken, zodat je generaliserende
conclusies kan trekken. Afwijkingen van gemiddelde waren extra interessant,
echte statistische testen.
> Aanloop tot ontwikkeling testtheorie, weinig complexe vaardigheden. Duidelijk zichtbare
eigenschappen.
Binet-Simon-Test (tot WO1)
1904: Doel van deze test was het onderscheid maken tussen luie en incapabele kinderen.
Eerste vorm van intelligentietest: welke vaardigheden moeten de leerlingen kennen en
kunnen? Door empirisch onderzoek werd de moeilijkheidsgraad vastgesteld. Ze werkten met
een totaalscore voor intelligentie en gebruikten om dit een naam te geven het begrip
“mentale leeftijd”. Erg individueel gericht. Weinig theoretisch onderbouwd.
- Geen valideringsonderzoek, is er samenhang met deze test en latere prestaties en
hoe selecteren we deelnemers?
Terman breidt deze test uit met omschreven instructies over de afname en zijn er normen
gebaseerd op een representatieve steekproef.
Na WO1: Army Alpha → snel selecteren wie in het leger kon.
Europa: Veel observaties, individuele diagnostiek en subjectieve beoordeling.
VS: Collectief testen, objectiviteit en veel niet-verbale testen voor immigranten.
Engeland: Tussenpositie.
In 1931 Thurstone: Misschien moeten we focus gaan leggen op betrouwbaarheid en
criteriumvaliditeit. Kunnen we straks gedrag voorspellen?
Begin WO2 - nu
- Aantal testen neemt toe vanwege snelle selectie, maar ook meer aandacht
überhaupt. Psychometrie: technieken die zich bezig houden met meten van
psychologische fenomenen.
- Sinds komst van de computer nog meer aandacht voor theorieontwikkeling over
testen en meten.
(Inhoud komt overeen met H2)
- Definitie, kenmerken en toepassingen van de test.
Eerste omschrijving “Test”
→ Een systematisch onderzoek van gedrag met behulp van speciaal geselecteerde vragen
of opgaven, met de bedoeling inzicht te krijgen in een psychologisch kenmerk van de
onderzochte in vergelijking met anderen.
Dus: Uitspraken over een individu, interpretatie is in vergelijking met wat gebruikelijke
uitkomsten zijn.
, Kenmerken “test” BOSVEN
1. Efficiëntie: Forceren van een situatie die het (hypothetische) construct beoogd te
meten. Doel hiervan is tijdswinst.
2. Standaardisatie: Procedure, het testmateriaal, de instructie en de verwerking moet
zoveel mogelijk hetzelfde zijn. Doel hiervan is testscores zo vergelijkbaar mogelijk
maken.
3. Normering: Interpretatie/betekenis van mogelijke scores op de test, met behulp van
grote norm steekproeven. Doel hiervan is testscores en interpretaties vergelijkbaar
maken.
4. Objectiviteit: Resultaat van het onderzoek is onafhankelijk van degene die de
gegevens verzamelt of uitwerkt. Impliceert de openheid en reproduceerbaarheid van
het onderzoek. Doel hiervan is de vergelijkbaarheid van testscores vergroten.
Mate van overeenstemming: Objectiviteit beoordelen, komen verschillende beoordelaars
tot hetzelfde resultaat?
Afhankelijk van het meetniveau van een schaal.
- Nominaal: ongeordende categorieën
- Ordinaal: geordende categorieën, maar ongelijke afstanden
- Interval: Geordende categorieën met gelijke afstanden.
5. Betrouwbaarheid: De herhaalbaarheid van het meetresultaat. Kom je tot dezelfde
conclusie als je twee keer dezelfde persoon meet onder identieke omstandigheden?
Doel hiervan: precisie van testscores vergroten
- Betrouwbaar als het testresultaat niet afhangt van het moment waarop getest
is.
6. Validiteit: meet mijn test wat hij beoogt te meten, en niet meer dan dat? Doel hiervan
is dat de testscores betekenis hebben.
(komt overeen met de inhoud van H3)
- Indelingen, onderscheidingen en begrippen
Overzicht van tests- indeling op basis van:
> Indeling naar testgedrag (meestvoorkomende)
Test voor prestatieniveau Test voor gedragswijze
Maximale prestatie, goed/fout - norm Hoe iemand iets doet, welke reactie geeft
hij
Totaalscore Persoonlijkheidskenmerken, voorkeuren en
attitudes