Hoorcollege 1: Factoranalyse
Factoranalyse
Factoranalyse is een statistische methode met als doel structuur aan te
brengen in een grote set variabelen. Vaak gaat het om vragenlijstitems of
testscores die onderling samenhangen. Die samenhang ontstaat meestal
niet toevallig, maar doordat deze variabelen een gemeenschappelijke
onderliggende oorzaak hebben: een factor.
Bijvoorbeeld: vermoeidheid, lusteloosheid, somberheid, extra
slaapbehoefte en sociaal isolement hangen vaak samen omdat ze
voortkomen uit één onderliggend construct, zoals een (herfst)depressie.
Factoranalyse probeert deze gemeenschappelijke achtergrond statistisch
zichtbaar te maken.
Onderzoeksvaliditeit bestaat uit meerdere vormen:
Interne validiteit: zijn alternatieve verklaringen uitgesloten?
Begripsvaliditeit (instrumentele validiteit): meet het instrument wat
het moet meten?
Externe validiteit: zijn resultaten te generaliseren?
Statistische validiteit: zijn de analyses correct en betrouwbaar?
Extra toelichting voor de soorten validiteit:
Een belangrijk kader waarin factoranalyse wordt gebruikt is
begripsvaliditeit. Begripsvaliditeit gaat over de vraag: meet mijn
instrument echt het theoretische begrip waarin ik geïnteresseerd ben?
Stel je maakt een test om herfstdepressie te meten, dan wil je dat de test
ook daadwerkelijk herfstdepressie meet en niet stress of vermoeidheid
door slaaptekort. Factoranalyse wordt ingezet om de interne structuur van
een meetinstrument te beoordelen en is daarmee direct gekoppeld aan
begripsvaliditeit.
Inhoudsvaliditeit (content validity)
Vraag: Dekt de test alle relevante aspecten van het begrip?
Voorbeeld:
Herfstdepressie bestaat uit meerdere kenmerken (somberheid,
vermoeidheid, sociale terugtrekking). Als je test alleen vragen bevat over
somberheid, maar niets over slaap of energie, is de inhoudsvaliditeit
laag.
Convergente validiteit
,Vraag: Hangt de test samen met andere metingen van hetzelfde of een
vergelijkbaar begrip?
Voorbeeld:
De herfstdepressietest correleert sterk met een bestaande
depressieschaal. Dat ondersteunt de validiteit, omdat beide vergelijkbare
constructen meten
Divergente validiteit
Vraag: Hangt de test juist níét (of zwak) samen met andere,
ongerelateerde constructen?
Voorbeeld:
De herfstdepressietest correleert nauwelijks met intelligentie of
extraversie. Dat is goed, want die begrippen horen theoretisch niet samen.
Criteriumvaliditeit
Vraag: Kan de test een relevant criterium voorspellen?
Voorbeeld:
Mensen met een hoge score op de herfstdepressietest melden zich vaker
ziek in de wintermaanden of functioneren slechter in die periode. Dit
ondersteunt de criteriumvaliditeit.
Interne validiteit
Vraag: Zijn alternatieve verklaringen voor het gevonden effect
uitgesloten?
Voorbeeld:
Als je een verband vindt tussen daglicht en herfstdepressie, maar je hebt
geen controle voor stress of slaaptekort, dan is de interne validiteit
beperkt.
Externe validiteit
Vraag: Kunnen de resultaten worden gegeneraliseerd?
Voorbeeld:
De test is alleen afgenomen bij studenten. Dan weet je niet zeker of de
resultaten ook gelden voor ouderen of werkenden → beperkte externe
validiteit.
Statistische validiteit
Vraag: Zijn de statistische conclusies correct? Voorbeeld:
Je vindt een significant effect van herfstdepressie, maar de steekproef is
heel klein en de power laag. Dan is de statistische validiteit zwak.
,Instrumentele validiteit: drie vormen
Inhoudsvaliditeit
Inhoudsvaliditeit (content validity) gaat over de vraag of een test het
volledige inhoudsdomein van het construct dekt. Dit wordt vaak vóór
dataverzameling beoordeeld, bijvoorbeeld door experts (face validity).
Voorbeeld: als stress theoretisch bestaat uit lichamelijke, cognitieve en
emotionele aspecten, dan moet een stressvragenlijst ook items bevatten
over alle deze aspecten.
Begripsvaliditeit
Begripsvaliditeit onderzoekt of de test daadwerkelijk het bedoelde
construct meet. Dit gebeurt op twee manieren:
1. Interne structuur: hangen items samen zoals de theorie voorspelt?
→ hier komt factoranalyse in beeld.
2. Externe structuur: correleert de test met andere variabelen zoals
verwacht?
Factoranalyse richt zich dus primair op interne structuur.
Criteriumvaliditeit
Criteriumvaliditeit gaat over de vraag of een test scores kan voorspellen
op een criterium dat niet in de test zelf zit. Bijvoorbeeld: voorspelt een
intelligentietest schoolsucces?
In grasple wordt dit verder uitgelegd in de voorkennisles validiteit.
Validiteit is onderdeel van de werkgroepen over methoden en komt
terug op het tentamen dus het is zeker een aanrader om dit goed te
kennen.
Twee hoofddoelen van factoranalyse
Factoranalyse heeft twee duidelijk te onderscheiden doelen, en dit bepaalt
welk type analyse je kiest.
Doel 1: dimensionaliteit beoordelen
Hier ga je na of de theoretisch veronderstelde dimensies (factoren) ook
daadwerkelijk in de data terugkomen.
, Je hebt dus vooraf verwachtingen, bijvoorbeeld:
Een vragenlijst meet twee constructen
of een intelligentietest bestaat uit een verbaal en performaal domein
Dit toets je met Confirmatieve Factoranalyse (CFA).
CFA wordt gebruikt om te beoordelen of de verwachte interne structuur
klopt en draagt direct bij aan begripsvaliditeit.
Doel 2: datareductie
Hier wil je een grote hoeveelheid informatie samenvatten in een kleiner
aantal variabelen (factoren). Je doel is dus het reduceren van variabelen.
Je wil een groot aantal variabelen samenvatten in een kleiner aantal nieuw
te construeren variabelen. Deze nieuw te construeren variabelen noemen
we factoren.
Bijvoorbeeld:
40 items reduceren tot 4 schalen
meerdere metingen terugbrengen tot een paar overzichtelijke
factoren
De elf subschalen van de WAIS III terugbrengen tot twee
samenvattende variabelen (in dit geval worden dat de performale en
verbale intelligentie.)
Dit kan met:
Exploratieve Factoranalyse (EFA)
Hoofdcomponentenanalyse (PCA)
Bij dit doel staat overzicht en vereenvoudiging centraal.
Stappen Factoranalyse
STAP 0: Datascreening: wanneer is factoranalyse zinvol?
Factoranalyse heeft alleen zin als er voldoende samenhang is tussen
variabelen.
Vuistregel:
Minstens één absolute correlatie groter dan .30. Dit wordt in het
hoorcollege aangegeven met: |r| > .30. Absolute waarde van .30
betekent dat dit beide kanten op mag gaan, .40 en -.40 voldoen dus
beide aan de vuistregel.
Zonder samenhang valt er niets te “clusteren” tot factoren.