Correlationeel
Hoorcollege 1: factoranalyse
Is er bij verschillende stimuli een gemeenschappelijke factor die een verklaring kan geven voor waarom sommige
mensen op deze stimuli zeggen waarom het zeer erg van toepassing is of juist niet van toepassing is. De
factoranalyse is een statistische techniek dat ons helpt om te beoordelen of deze gemeenschappelijke factor
gevonden kan worden.
‘Hersfstdepressie’ is bijvoorbeeld een gemeenschappelijk factor waarom vermoeidheid, lusteloosheid,
stemmingswisselingen etc. van toepassing zijn
De stimuli worden hierbij omgezet in items in bijvoorbeeld een vragenlijst. Hieruit komt een score.
Onderzoeksvaliditeit
Onderzoeksvaliditeit
Externe validiteit
Interne validiteit
Begripsvaliditeit (instrumentele validiteit) > hier valt factoranalyse onder
Statistische validiteit
Instrumentele validiteit
De mate waarin een test aan zijn doel beantwoordt.
Inhoudsvaliditeit (content validity)
Begripsvaliditeit (construct validity)
Criteriumvaliditeit (criterium validity)
Soorten validiteit(sbeoordeling)
1. Inhoudsvaliditeit (content validity) > Representeert de inhoud van de test het gehele inhoudsdomein?
o Deskundigen oordeel/ indruksvaliditeit (face validity)
2. Begripsvaliditeit (construct validity) > Meet de test het theoretische concept dat moet worden gemeten?
Dit gebeurd door 2 soorten van onderzoek:
o Onderzoek naar relaties binnen test (interne structuur) > het vinden van een relatie ondersteund de
begripsvaliditeit
o Onderzoek naar relaties met andere variabelen (externe structuur) > het vinden van een relatie
ondersteund de begripsvaliditeit
3. Criteriumvaliditeit (criterion validity) > Voorspelt de test gedrag of prestatie (criterium) dat niet met test wordt
gemeten?
o Beoordeel een voorspelling op criterium met de test
Factoranalyse gaat over het onderzoek naar relaties binnen de test (interne structuur) > begripsvaliditeit
De gemeenschappelijke factor bij factoranalyse verklaart de onderlinge samenhang. Dit kan met 1 of 2 achterliggende
factoren.
Twee doelen factoranalyse
1. Beoordelen dimensionaliteit van test > Vinden we het aantal theoretisch veronderstelde dimensies (=
factoren) binnen de verzameling van testitems?
o Als we 1 achterliggende factor kunnen vinden, noemen we dit eendimensionaal. Als we meerdere
achterliggende factoren kunnen vinden, noemen we dat meerdimensionaal.
o We spreken van een confirmerende factoranalyse (CFA) = bevestiging zoeken van een
theoretische veronderstelling
2. Realiseren van datareductie > Kunnen we informatie uit groot aantal variabelen samenvatten in kleiner
aantal nieuw te construeren variabelen (= factoren)? > je vervangt alle losse items door maar 1 score
o We spreken van explorerende factoranalyse (EFA)
o We spreken van hoofdcomponentenanalyse (PCA)
Variabelen kunnen items zijn, maar ook testscores (zoals de WAIS III)
Voorbeeld WAIS III
De WAIS III bevat 11 subtests voor de algemene intelligentietest
1. Algemene ontwikkeling 2. Gezond verstand 3. Cijfers nazeggen 4. Rekenen 5. Overeenkomsten 6. Woordenlijst 7.
Plaatjes rangschikken 8. Plaatjes aanvullen 9. Blokpatronen 10. Legkaarten 11. Cijfersymbolen
De factoranalyse moet nagaan of we een gemeenschappelijke factor kunnen vinden in deze 11 testscores. We gaan
kijken of we statistisch een ondersteuning vinden voor het theoretische model
,Theoretisch model WAIS III
Achterliggend veronderstellen we 2 factoren voor deze 11 tests > de combinatie van deze 2 achterliggende factoren
zijn bepalend voor hoe mensen scoren op deze 11 tests.
1. Verbale intelligentie > invloed op 1-6
2. Performale intelligentie > invloed op 7-11
We hebben ook nog een algemene factor: algemene intelligentie. > heeft weer invloed op de verbale en performale
intelligentie
Stappen in factoranalyse
Factormodellen
Hoofdcomponentenanalyse (PCA)
Exploratieve factoranalyse (EFA)
Confirmatieve factoranalyse (CFA)
Aantal factoren
Eigenwaarde criterium
Knikcriterium
Interpreteren factoren
Orthogonale rotatie
Oblique rotatie
Kwaliteit factoroplossing
Simple structure
Correlatie tussen factoren
Proportie verklaarde variantie factoren
Communaliteit
Factoranalyse stap 0: datascreening
Nagaan of de data die je hebt verzameld geschikt is voor het uitvoeren van een factoranalyse. We moeten hierbij
kijken of er überhaupt sprake is van samenhang binnen de variabelen die we hebben gemeten (tussen de testscores
of items) = datascreening
Correlatiematrix
Vraag: Is een factoranalyse zinvol voor deze data?
Vuistregel: Minstens 1 absolute correlatiecoëfficiënt r groter dan 0.30 > er zijn in deze matrix meerdere
correlatiecoëfficiënten groter dan 0.30 > data is geschikt voor een factoranalyse
Factoranalyse stap 1: welk model kies je?
Keuze factormodel is afhankelijk van het doel
PCA: Principal Components Analyses - Hoofdcomponenten analyse
EFA: Exploratory Factor Analyses - Exploratieve factoranalyse
CFA: Confirmatory Factor Analyses - Confirmatieve factoranalyse
Factormodel PCA
Zx1 staat voor item 1 van de intelligentietest enz. Dit komt omdat de factoranalyse wordt uitgevoerd op basis van
correlaties. Correlaties zijn een gestandaardiseerde maat voor lineaire samenhang. We standaardiseren dus
testscores naar z-scores
Hoofdcomponentenanalyse (PCA) > Hoe kan met zo weinig mogelijk factoren (componenten) zo veel als mogelijk
variantie representeren?
Anders gezegd: We willen met zo weinig mogelijk nieuwe variabelen, zo veel mogelijk van de variatie die in de
oorspronkelijke hoeveelheid variabelen zat, representeren.
We verwachten een relatie tussen Zx1 - Zx11 met de 2 componenten (verbale en performale intelligentie). Van sommige
van de testscores verwachten we dat deze relatie sterker is dan van andere, maar we verwachten dat ze allemaal een
relatie hebben met de 2 componenten.
De 2 componenten worden aangeduid met C1 en C2
, De sterkte van de relatie wordt aangeduid met a = factorlading
Factormodel EFA
Exploratieve Factoranalyse (EFA) > Hoeveel inhoudelijk interpreteerbare factoren zijn te onderscheiden?
We veronderstellen dat het aantal factoren onbekend is. De pijlen staan de andere kant op
Bij de PCA veronderstellen we dat de componenten alle variatie verklaren in de afzonderlijke items, maar hier
veronderstellen we ook dat er unieke factoren zijn U (= unieke factor). Deze unieke factoren zijn ook mede
bepalend hoe de scores op een bepaalde test tot stand komen.
Bij PCA gaat het meer over hoeveel factoren er uberhaupt zijn. Bij EFA gaat het ook over of deze factoren inhoudelijk
interpreteerbaar zijn
Factormodel CFA
Confirmatieve Factoranalyse (CFA) > Is in de data ondersteuning voor een verwacht aantal factoren?
Het aantal factoren is bekend. De pijlen zijn zoals als bij EFA. Het model volgt de verwachte structuur en met
U (unieke factor)
Hier is ook explicieter aangegeven dat F1 geldt voor de eerst 6 items (verbaal) en F2 voor de laatste items
(performaal)
Toelichting factormodel
Geobserveerde variabele (X , ZX)
X = individuele score op variabele (testscore)
ZX = X getransformeerd naar z-score
X −X
ZX=
SX
S = standaardafwijking
X met streepje = gemiddelde score
Factorlading (a) = Correlatie van variabele (testscore) met factor. NB. De factorladingen a worden geschat.
Factor (F) = Achterliggende verklaring voor variatie (variantie) in en samenhang (correlaties) tussen de variabelen.
NB. In PCA spreekt men van componenten in plaats van factoren.
, Unieke factor (u) = Unieke factor voor verklaring van specifieke en error variantie
Welk factormodel kies je?
Het resultaat (factoroplossing) van de modellen komt overeen, maar …
Hoofdcomponentenanalyse (PCA) als reductie het doel is van de factoranalyse.
Exploratieve factoranalyse (EFA) als inhoudelijke interpretatie van nog onbekend aantal factor(en) het doel is
van de factoranalyse.
Confirmatieve factoranalyse (CFA) als beoordeling van de verwachte interne structuur (= validiteit) het doel is
van de factoranalyse.
Resultaat factoranalyse
Schatting van de factorladingen (a)
Factorscores
Informatie voor keuze aantal en interpretatie van te onderscheiden factoren: eigenwaarden, factorcorrelaties,
verklaarde variantie,
Vergelijking voor factorscore F
F ji =a1 j Z 1i + a2 j Z 2 i+ …+a kj Z ki
Fji = factorscore op factor j voor persoon i
A1j = factorlading a van gestandaardiseerde variabele 1 voor factor j
Z1j = gestandaardiseerde score van persoon i op variabele 1
Factorscore F
Voor iedere variabele een aparte factorscore
Voor ieder individu een score op (elke) factor.
Voor persoon i is Fji de gewogen som (lineaire combinatie) van k naar Z gestandaardiseerde variabelen.
F is een nieuwe variabele.
Voor verdeling van factorscores geldt:
o Gemiddelde M = 0
o Standaardafwijking SD = 1
Factoranalyse stap 2: aantal factoren?
Bepalen aantal factoren > twee criteria om dit te bepalen
Eigenwaarde criterium
Knikcriterium
Correlatiematrix WAIS
Vraag: Zijn er 2 zinvol te onderscheiden factoren? confirmerende factoranalyse
Factormatrix
Vraag: Zijn deze 2 factoren statistisch zinvol?
Aantal factoren?
Aantal mogelijke factoren: maximaal aantal factoren is gelijk aan totaal aantal variabelen (k) in de analyse.