Aantekeningen VOS Hoorcollege 1 Factoranalyse (correlationeel)
Factoranalyse = een statische techniek die ons helpt, om te beoordelen of
er achter een verzameling stimuli een gemeenschappelijke factor
gevonden kan worden, die een verklaring geeft waarom mensen op een
verzameling stimuli een bepaald antwoord geven.
(gemeenschappelijke achtergrond zoeken we dus)
Als we de factoranalyse een kader geven kijken we naar validiteit, hoe
geldig zijn je conclusies?
Onderzoek validiteit, hoe kan je nou precies de resultaten
interpreteren? 4 vormen validiteit:
1. Begripsvaliditeit (instrumentele validiteit)
Hoe goed worden de variabele gemeten? Onafhankelijke variabele is
de gemanipuleerde variabele. Afhankelijke variabele is de
uitkomstvariabele.
2. Interne validiteit
Het uitsluiten van alternatieve verklaringen.
3. Externe validiteit
Kunnen die resultaten ook echt gegeneraliseerd worden? -> 2
dingen die invloed hebben:
- Type steekproef. Bijv. het gebruik van een selecte steekproef leidt tot
lagere externe validiteit.
- Setting van het experiment. Komt de setting precies overeen met de
werkelijkheid? De mate van overeenkomst tussen de werkelijkheid
en de experimentele setting heet de ecologische validiteit.
4. Statistische validiteit
De mate waarin de resultaten van een statistische analyse
nauwkeurig en redelijk zijn. Bij een grote steekproef kan een klein
verschil al significant zijn. Maar een significant effect is niet
hetzelfde als een groot effect.
Instrumentele validiteit, de mate waarin een test aan zijn doel
beantwoordt. Hoe goed is je meetinstrument?
1. Begripsvaliditeit, meet het instrument wat het hoort te meten. Dit
toetsen we door:
Relaties binnen de test, interne structuur. factoranalyse,
want we hebben een verwachting over de relaties binnen de
test.
Relaties met andere variabelen, externe structuur.
2. Inhoudsvaliditeit, worden alle aspecten van dat theoretische begrip
eigenlijk wel gemeten.
3. Criteriumvaliditeit, dat we eigenlijk al weten dat er een relatie is
tussen de variabelen die we ogen te meten en een andere variabel.
Als ik weet dat die relatie bestaat dan moet ik dit ook kunnen meten
met mijn meetinstrument. Als je dit niet terugvindt, dan kan het zijn
dat je toch iets anders aan het meten bent. Het terugvinden van een
relatie met iets anders, waarvan we weten dat die relatie bestaat.
,Twee doelen factoranalyse:
- Beoordelen dimensionaliteit van test. Met de factoranalyse
kunnen we uit de data halen wat voor achterliggende factoren er
zijn. We kunnen kijken of er ondersteuning is voor het idee dat ons
instrument meer dimensionaal is, zijn er meerdere achterliggende
factoren.
deze toepassing van de factoranalyse noemen we confirmerende
factoranalyse (CFA). Het vinden van een bevestiging van onze
verwachting over de interne structuur. Als we 1 dementie
verwachten we doen de factoranalyse we vinden 1 dementie
het is een ondersteuning van de begripsvaliditeit.
- Realiseren van datareductie. We hebben een verzameling van
variabelen, deze moeten we zien te krijgen tot 1 score (data
reductie). Dit kan alleen als we een ondersteuning hebben van het
idee dat er een achterliggende variabele is die kan verklaren.
Kunnen we informatie uit groot aantal variabelen samenvatting in
kleiner aantal nieuw te construeren variabelen (factoren).
explorerende factoranalyse (EFA)= we hebben van tevoren geen
idee over de interne structuur.
hoofdcomponentenanalyse (PCA) = we hebben van tevoren een
idee over de interne structuur.
Stappen factoranalyse uitvoeren:
Stap 0: datascreening
Er moet minimaal één correlatie zijn van > 0.3, dan pas is een
factoranalyse zinvol. Dit kan je vinden in de correlatiematrix.
Stap 1: Keuze van het factormodel
PCA, hoe kan je met zo weinig mogelijk
factoren (componenten), zoveel mogelijk
variantie (spreiding in de scores) verklaren.
EFA, het aantal factoren is van tevoren
onbekend. De factoren zijn een verklaring
voor de observaties, de pijlen staan de
andere kant op.
De U, betekent een unieke factor = voor
alle observaties zien we dat er nog iets is
dat ook een invloed heeft.
CFA, als we van tevoren een heel
duidelijk beeld hebben over het
aantal achterliggende factoren. We
, gaan testen of dit beeld klopt. Er is nu heel specifiek welke factor bij
welke variabele horen.
Symbolen uit deze figuren:
- X = individuele score op variabele.
- Zx = X getransformeerd naar z-score.
- a (factorlading) = correlatie van variabele en factor.
- F (factor) = achterliggende verklaring voor variatie (variantie) in en
samenhang (correlatie) tussen de variabelen.
- u = unieke factor voor verklaring van specifieke en error variantie.
PCA, als reductie het doel is van de factoranalyse.
EFA, als inhoudelijke interpretatie (van mogelijk achterliggende
factoren) van nog onbekend aantal factor(en) het doel is van de
factoranalyse.
CFA, als beoordeling van de verwachte interne structuur (validiteit)
het doel is van de factoranalyse.
Stap 2: wat is het statistisch gezien aantal factoren die we kunnen
selecteren?
Kunnen we factoren vinden die een verklaring vormen voor de samenhang
tussen alle correlaties. We krijgen factorladingen (a), dit zegt ons iets over
de sterkte van de samenhang die het veroorzaakt.
- Factor 1 is de factor die de meeste variantie verklaard.
- Factor 2 is verklaard daarna de meeste variantie.
- Etc.
- Tot dat je bij factor K komt, alle variantie is verklaard.
We gebruiken hier twee criteria voor:
1. Eigenwaarde, de verklaarde variantie door de factor. Elke factor
heeft een eigenwaarde. Een groot getal betekend veel, klein
betekend weinig.
Eigenwaarde-criterium = kies in eerste instantie, voor het aantal
factoren met een eigenwaarde groter dan 1.
2. Knikcriterium
Scree-plot = alle eigenwaarde de
factoren in een grafiek. In dit
, plaatje zit een knik. Het aantal factoren boven die knik, is het aantal
factoren dat we kiezen.
Stap 3: Interpreteren van de factor(en)
Wat is de inhoudelijke betekenis (interpretatie) van de factor? Roteren
(orthogonaal of obilique) van de factoroplossing. Na die rotatie,
veranderen de factorladingen en zijn we beter in staat om een
interpretatie te doen. Variabele met hoogste lading is meest kenmerkend
voor factor, gebruik de variabelen met hoge lading > 0.3.
Rotatie = letterlijk draaien, de factorladingen veranderen. De uitkomst van
de rotatie gebruik je voor de interpretatie. 2 soorten rotaties:
- Orthogonaal (recht), het resultaat hiervan is dat de onafhankelijke
factoren die uit de factoranalyse komen, niet samenhangen. Assen
staan na rotatie loodrecht op elkaar. De factoren zijn statistisch ook
onafhankelijk (ze hangen niet samen).
- Oblique (scheve), levert wel correlatie op tussen de factoren. Na
rotatie meer of minder gecorreleerde factoren. Assen staan niet
loodrecht op elkaar.
Stap 4: Kwaliteit van de factoroplossing
Simple structure = een factorladingenmatrix die makkelijk af te lezen is,
de factoren zijn duidelijk te koppelen.
- Op elke factor klein aantal variabelen met sterke lading.
- Op elke factor groot aantal variabelen met zwakke lading.
- Elke variabele heeft op één factor een sterke lading.
Proportie verklaarde variantie =
Communaliteit/ uniciteit =
Aantekeningen werkgroep 1
Normale regressieanalyse = alle onafhankelijke variabelen worden meteen
allemaal meegenomen om te kijken welk effect het heeft op de
afhankelijke variabele.
Hiërarchische regressieanalyse = de onafhankelijke variabelen worden
opgedeeld, je begint met een paar en daar ga je er dan meer bij
toevoegen, om de vraag te beantwoorden: heeft het toevoegen van deze
onafhankelijke variabelen een effect op de afhankelijke variabele.
R2 = Verklaarde variantie, hoe hoger hoe beter. Als je modellen vergelijkt
welke het beste is kijk je hiernaar. Degene met de hoogste R2, kan je het
beste dan kiezen.
- Bijv. 0.521 52,1% variantie.
Aangepaste R2 = hoe meer variabele je toevoegt, hoe hoger je R2. De
aangepaste R2, past dit aan (dit boet er dus voor). Het is een betere
schatting van hoeveel variantie in de populatie zal voorkomen.
P-waarde kleiner dan de gestelde Alpha is significant.
Factoranalyse = een statische techniek die ons helpt, om te beoordelen of
er achter een verzameling stimuli een gemeenschappelijke factor
gevonden kan worden, die een verklaring geeft waarom mensen op een
verzameling stimuli een bepaald antwoord geven.
(gemeenschappelijke achtergrond zoeken we dus)
Als we de factoranalyse een kader geven kijken we naar validiteit, hoe
geldig zijn je conclusies?
Onderzoek validiteit, hoe kan je nou precies de resultaten
interpreteren? 4 vormen validiteit:
1. Begripsvaliditeit (instrumentele validiteit)
Hoe goed worden de variabele gemeten? Onafhankelijke variabele is
de gemanipuleerde variabele. Afhankelijke variabele is de
uitkomstvariabele.
2. Interne validiteit
Het uitsluiten van alternatieve verklaringen.
3. Externe validiteit
Kunnen die resultaten ook echt gegeneraliseerd worden? -> 2
dingen die invloed hebben:
- Type steekproef. Bijv. het gebruik van een selecte steekproef leidt tot
lagere externe validiteit.
- Setting van het experiment. Komt de setting precies overeen met de
werkelijkheid? De mate van overeenkomst tussen de werkelijkheid
en de experimentele setting heet de ecologische validiteit.
4. Statistische validiteit
De mate waarin de resultaten van een statistische analyse
nauwkeurig en redelijk zijn. Bij een grote steekproef kan een klein
verschil al significant zijn. Maar een significant effect is niet
hetzelfde als een groot effect.
Instrumentele validiteit, de mate waarin een test aan zijn doel
beantwoordt. Hoe goed is je meetinstrument?
1. Begripsvaliditeit, meet het instrument wat het hoort te meten. Dit
toetsen we door:
Relaties binnen de test, interne structuur. factoranalyse,
want we hebben een verwachting over de relaties binnen de
test.
Relaties met andere variabelen, externe structuur.
2. Inhoudsvaliditeit, worden alle aspecten van dat theoretische begrip
eigenlijk wel gemeten.
3. Criteriumvaliditeit, dat we eigenlijk al weten dat er een relatie is
tussen de variabelen die we ogen te meten en een andere variabel.
Als ik weet dat die relatie bestaat dan moet ik dit ook kunnen meten
met mijn meetinstrument. Als je dit niet terugvindt, dan kan het zijn
dat je toch iets anders aan het meten bent. Het terugvinden van een
relatie met iets anders, waarvan we weten dat die relatie bestaat.
,Twee doelen factoranalyse:
- Beoordelen dimensionaliteit van test. Met de factoranalyse
kunnen we uit de data halen wat voor achterliggende factoren er
zijn. We kunnen kijken of er ondersteuning is voor het idee dat ons
instrument meer dimensionaal is, zijn er meerdere achterliggende
factoren.
deze toepassing van de factoranalyse noemen we confirmerende
factoranalyse (CFA). Het vinden van een bevestiging van onze
verwachting over de interne structuur. Als we 1 dementie
verwachten we doen de factoranalyse we vinden 1 dementie
het is een ondersteuning van de begripsvaliditeit.
- Realiseren van datareductie. We hebben een verzameling van
variabelen, deze moeten we zien te krijgen tot 1 score (data
reductie). Dit kan alleen als we een ondersteuning hebben van het
idee dat er een achterliggende variabele is die kan verklaren.
Kunnen we informatie uit groot aantal variabelen samenvatting in
kleiner aantal nieuw te construeren variabelen (factoren).
explorerende factoranalyse (EFA)= we hebben van tevoren geen
idee over de interne structuur.
hoofdcomponentenanalyse (PCA) = we hebben van tevoren een
idee over de interne structuur.
Stappen factoranalyse uitvoeren:
Stap 0: datascreening
Er moet minimaal één correlatie zijn van > 0.3, dan pas is een
factoranalyse zinvol. Dit kan je vinden in de correlatiematrix.
Stap 1: Keuze van het factormodel
PCA, hoe kan je met zo weinig mogelijk
factoren (componenten), zoveel mogelijk
variantie (spreiding in de scores) verklaren.
EFA, het aantal factoren is van tevoren
onbekend. De factoren zijn een verklaring
voor de observaties, de pijlen staan de
andere kant op.
De U, betekent een unieke factor = voor
alle observaties zien we dat er nog iets is
dat ook een invloed heeft.
CFA, als we van tevoren een heel
duidelijk beeld hebben over het
aantal achterliggende factoren. We
, gaan testen of dit beeld klopt. Er is nu heel specifiek welke factor bij
welke variabele horen.
Symbolen uit deze figuren:
- X = individuele score op variabele.
- Zx = X getransformeerd naar z-score.
- a (factorlading) = correlatie van variabele en factor.
- F (factor) = achterliggende verklaring voor variatie (variantie) in en
samenhang (correlatie) tussen de variabelen.
- u = unieke factor voor verklaring van specifieke en error variantie.
PCA, als reductie het doel is van de factoranalyse.
EFA, als inhoudelijke interpretatie (van mogelijk achterliggende
factoren) van nog onbekend aantal factor(en) het doel is van de
factoranalyse.
CFA, als beoordeling van de verwachte interne structuur (validiteit)
het doel is van de factoranalyse.
Stap 2: wat is het statistisch gezien aantal factoren die we kunnen
selecteren?
Kunnen we factoren vinden die een verklaring vormen voor de samenhang
tussen alle correlaties. We krijgen factorladingen (a), dit zegt ons iets over
de sterkte van de samenhang die het veroorzaakt.
- Factor 1 is de factor die de meeste variantie verklaard.
- Factor 2 is verklaard daarna de meeste variantie.
- Etc.
- Tot dat je bij factor K komt, alle variantie is verklaard.
We gebruiken hier twee criteria voor:
1. Eigenwaarde, de verklaarde variantie door de factor. Elke factor
heeft een eigenwaarde. Een groot getal betekend veel, klein
betekend weinig.
Eigenwaarde-criterium = kies in eerste instantie, voor het aantal
factoren met een eigenwaarde groter dan 1.
2. Knikcriterium
Scree-plot = alle eigenwaarde de
factoren in een grafiek. In dit
, plaatje zit een knik. Het aantal factoren boven die knik, is het aantal
factoren dat we kiezen.
Stap 3: Interpreteren van de factor(en)
Wat is de inhoudelijke betekenis (interpretatie) van de factor? Roteren
(orthogonaal of obilique) van de factoroplossing. Na die rotatie,
veranderen de factorladingen en zijn we beter in staat om een
interpretatie te doen. Variabele met hoogste lading is meest kenmerkend
voor factor, gebruik de variabelen met hoge lading > 0.3.
Rotatie = letterlijk draaien, de factorladingen veranderen. De uitkomst van
de rotatie gebruik je voor de interpretatie. 2 soorten rotaties:
- Orthogonaal (recht), het resultaat hiervan is dat de onafhankelijke
factoren die uit de factoranalyse komen, niet samenhangen. Assen
staan na rotatie loodrecht op elkaar. De factoren zijn statistisch ook
onafhankelijk (ze hangen niet samen).
- Oblique (scheve), levert wel correlatie op tussen de factoren. Na
rotatie meer of minder gecorreleerde factoren. Assen staan niet
loodrecht op elkaar.
Stap 4: Kwaliteit van de factoroplossing
Simple structure = een factorladingenmatrix die makkelijk af te lezen is,
de factoren zijn duidelijk te koppelen.
- Op elke factor klein aantal variabelen met sterke lading.
- Op elke factor groot aantal variabelen met zwakke lading.
- Elke variabele heeft op één factor een sterke lading.
Proportie verklaarde variantie =
Communaliteit/ uniciteit =
Aantekeningen werkgroep 1
Normale regressieanalyse = alle onafhankelijke variabelen worden meteen
allemaal meegenomen om te kijken welk effect het heeft op de
afhankelijke variabele.
Hiërarchische regressieanalyse = de onafhankelijke variabelen worden
opgedeeld, je begint met een paar en daar ga je er dan meer bij
toevoegen, om de vraag te beantwoorden: heeft het toevoegen van deze
onafhankelijke variabelen een effect op de afhankelijke variabele.
R2 = Verklaarde variantie, hoe hoger hoe beter. Als je modellen vergelijkt
welke het beste is kijk je hiernaar. Degene met de hoogste R2, kan je het
beste dan kiezen.
- Bijv. 0.521 52,1% variantie.
Aangepaste R2 = hoe meer variabele je toevoegt, hoe hoger je R2. De
aangepaste R2, past dit aan (dit boet er dus voor). Het is een betere
schatting van hoeveel variantie in de populatie zal voorkomen.
P-waarde kleiner dan de gestelde Alpha is significant.