HC1 - Correlationeel I
Correlationele data: gegevens worden op verschillende manieren gegenereerd
- Toevallig: AKA organisch (instagram)
- - Aspirational: data die we genereren omdat wij het willlen als mensen (social media)
- - Transactional: data door transacties (betaalpas, jumbo)
- Doelgericht: AKA ontworpen / designed (wetenschappelijk onderzoek)
- - Experiment
- - Survey: vragenlijsten
- - Administrative: administratieve data (overheid, belastingdienst)
Correlationele data (designed)
- We ontwerpen een onderzoek en verzamelen gegevens om (inferentiele doelen):
- - de sociale werkelijkheid te beschrijven (beschrijven)
- - (causale) relaties bestuderen (causaliteit)
- - te generaliseren naar de doelpopulatie (voorspellen)
Hoe te bevragen? Soorten surveys
- Face-to-face (CAPI): vooral bij kinderen en ouderen
- Post: vragenlijst op papier
- Telefonisch (CATI)
- Via het internet
- Mixed-modes
Verschillen tussen typen surveys/vragenlijsten
- Mate van betrokkenheid van interviewer
- Mate van interactie met de respondent
- Mate van privacy: post en internet meer privacy
- Communicatiemogelijkheden: visueel, auditief
- Gebruik technologie
Soorten surveys in NL
- Bevolkingsregister (iedereen staat geregistreerd) en meer dan 90% internetgebruik:
telefonische enquetes (random digit dialing) niet veel gebruikt
- Combinaties veel gebruikt:
1
, - - Uitnodiging via de post voor internetenquete
- - Telefooncomponent indien nummers bekend zijn
- Marktonderzoekers gebruiken zowel selecte als aselecte online panels
- Surveys ontworpen speciaal voor verschillende digitale media: zowel computer als
smartphone
Mode-effect: is er een effect van de vorm van vragenlijst die gebruikt is
Interviewer-effect: is er een effect van de interviewer op de antwoorden
Cohort effect: de invloed die specifieke, tijdsgebonden maatschappelijke gebeurtenissen op
een cohort kunnen hebben
Leereffect: de invloed van herhaaldelijk dezelfde vragenlijst invullen
Cross-sectionele en panelonderzoeken
- Panelonderzoeken volgen respondenten over een langere periode
- - Inhoud van de vragenlijsten is meestal hetzelfde, maar kan verschillen
- Voordelen:
- - We kunnen binnen-persoon verandering en causaliteit meten
- - We kunnen leeftijds, periode en cohort effecten verklaren
- Potentiele fouten:
- - Verloop (attrition): uitval van mensen, nonrespons in opeenvolgende rondes
- - Panel conditionering: leereffecten
Operationaliseren
- Om een theoretisch begrip te meten, moeten onderzoekers bepaalde stappen volgen:
- Theoretisch begrip conceptuele definitie operationele definitie variabele
Voordeel vragenlijst: er kunnen meerdere vragen gesteld kunnen worden over hetzelfde
onderwerp vragenlijst kan allerlei verschillende aspecten van theoretisch aspect
ondervragen
Itemscore: score op 1 vraag
Wat doet onderzoeker met dataset?
1. Coderen van de antwoorden: meestal met getalletjes van links naar rechts
2. Itemscores: bijv. wat is itemcore op vraag 2 etc.
3. Een variabele creeren
Doel: 1 score maken die ernst van bijv. PTSS aangeeft
Optie 1:
- Tel alle itemscores bij elkaar op
- 12 items, itemscore tussen de 1 en 4 schaalscores tussen de 12 en de 48
- Maar er zijn vaak nonresponsen en dan kan je die mensen niet meetellen
Optie 2:
- Bereken het gemiddelde van alle itemscores
2
, - Dit kan ook berekend worden met een paar missende waarden
Optie 3:
- Gewogen gemiddelde van itemscores: bepaalde vragen wegen zwaarder dan andere
vragen
Let op
- Een lage score zou ‘milde of geen van theoretisch begrip’ moeten betekenen
- Een hoge score zou ‘ernstige van theoretisch begrip’ moeten betekenen
- In veel vragenlijsten vinden we omgekeerd geformuleerde items
Omgekeerd geformuleerde items
- Hoge score betekent hoge bijv. PTSS
- Maar bij sommige items hoge score juist weinig PTSS: omgekeerd geformuleerde
items
- Reden: zodat mensen goed lezen en nadenken en bijv. niet makkelijk zeggen ik heb
geen PTSS dus ik doe alles 1: straight-lining
- Vallen op bij de antwoorden data set en bij gemiddelden per vraag descriptive
statistics
Wat te doen?
- Omgekeerd geformuleerde items moeten omgekeerd worden gecodeerd:
hercoderen, ompolen
- 14, 23, 32, 41
Dit is stap 1 in mogelijk maken om variabele te creeren, voorbereiden van de data
Bij beschrijvende statistiek frequentie tabel controle of omkeren is gelukt
Schaalscores berekenen
- Als alle items op juiste manier gecodeert zijn, dan kan schaalscore berekent worden
- Met de omgepoolde items kan nu een schaalscore worden berekened
- We gaan kijken naar of de som of de gemiddelde van al die items
- PTSS schaalscore, variabele berekenen = gemiddelde over alle items per persoon
(omgepoolde items worden gebruikt)
- Hieruit komen per persoon getallen en dat zijn de PTSS scores die we gaan gebruiken
als variabele om PTSS mee te meten
Goed verschil weten tussen schaalscore en itemscore
Met beschrijvende statistiek van schaalscore kun je minimum en maximun gegeven
antwoord etc. zien je kan met deze variabele ook grafieken maken, correlaties met andere
variabele berekenen, kijken of verschillen zijn tussen verschillende groepen etc.
Schaalscore vormt die variabele aan het einde van operationalisatie proces
3
, HC2 - Correlationeel II
Hoe weten we of een meetinstrument een goed instrument is?
- Begripsvaliditeit
- Betrouwbaarheid
Betrouwbaarheid en validiteit
- Betrouwbare meting:
- - De meting varieert niet door kenmerken van de manier waarop je hebt gemeten of
het meetinstrument
- - AKA precisie, consistentie van de meting
- - Voorbeeld: een weegschaal in de badkamer moet hetzelfde gewicht aangeven als je
er twee keer op stapt
- Valide meting:
- - Hoe goed je meting overeenkomt met het theoretische begrip waarin je
geinteresseerd bent
- - AKA nauwkeurigheid, correctheid van de meting
(Begrips)validiteit
- Indruk: lijkt de meting in orde?
- Inhoud: meet het alle aspecten van het construct?
- Convergent: correleert het met een andere meting van hetzelfde construct?
- Divergent: correleert het niet met iets dat iets anders meet?
- Criterium: correleert het met een andere meting waarvan we weten dat de relatie er
is?
Sterkte relatie meten: correlatie
- We meten de sterkte van de relatie met een correlatie
- Een maat voor het meten van de sterkte en richting van een lineaire relatie tussen
twee interval/ratio variabelen
- Aangegeven met r
- Waarden tussen -1 en 1
- Correlatie kan ook gebruikt worden om validiteit te meten
Betrouwbaarheid
- Test-hertest: vragenlijst aan groep mensen op later moment zelfde vragenlijst aan
zelfde groep mensen
- Interbeoordelaar: vooral bij observaties, verschillende mensen observeren hetzelfde
- Interne: wordt gemeten door cronbachs alfa
Betrouwbaarheid: hoe te meten zonder herhaalde metingen
- Cronbach’s alpha
- Meet interne consistentie: in welke mate zijn de items in een vragenlijst met elkaar
gecorreleerd
- Complexe berekeningen computer
- Hoe beter al die items met elkaar overeenkomen, hoe hoger die waarde
4
Correlationele data: gegevens worden op verschillende manieren gegenereerd
- Toevallig: AKA organisch (instagram)
- - Aspirational: data die we genereren omdat wij het willlen als mensen (social media)
- - Transactional: data door transacties (betaalpas, jumbo)
- Doelgericht: AKA ontworpen / designed (wetenschappelijk onderzoek)
- - Experiment
- - Survey: vragenlijsten
- - Administrative: administratieve data (overheid, belastingdienst)
Correlationele data (designed)
- We ontwerpen een onderzoek en verzamelen gegevens om (inferentiele doelen):
- - de sociale werkelijkheid te beschrijven (beschrijven)
- - (causale) relaties bestuderen (causaliteit)
- - te generaliseren naar de doelpopulatie (voorspellen)
Hoe te bevragen? Soorten surveys
- Face-to-face (CAPI): vooral bij kinderen en ouderen
- Post: vragenlijst op papier
- Telefonisch (CATI)
- Via het internet
- Mixed-modes
Verschillen tussen typen surveys/vragenlijsten
- Mate van betrokkenheid van interviewer
- Mate van interactie met de respondent
- Mate van privacy: post en internet meer privacy
- Communicatiemogelijkheden: visueel, auditief
- Gebruik technologie
Soorten surveys in NL
- Bevolkingsregister (iedereen staat geregistreerd) en meer dan 90% internetgebruik:
telefonische enquetes (random digit dialing) niet veel gebruikt
- Combinaties veel gebruikt:
1
, - - Uitnodiging via de post voor internetenquete
- - Telefooncomponent indien nummers bekend zijn
- Marktonderzoekers gebruiken zowel selecte als aselecte online panels
- Surveys ontworpen speciaal voor verschillende digitale media: zowel computer als
smartphone
Mode-effect: is er een effect van de vorm van vragenlijst die gebruikt is
Interviewer-effect: is er een effect van de interviewer op de antwoorden
Cohort effect: de invloed die specifieke, tijdsgebonden maatschappelijke gebeurtenissen op
een cohort kunnen hebben
Leereffect: de invloed van herhaaldelijk dezelfde vragenlijst invullen
Cross-sectionele en panelonderzoeken
- Panelonderzoeken volgen respondenten over een langere periode
- - Inhoud van de vragenlijsten is meestal hetzelfde, maar kan verschillen
- Voordelen:
- - We kunnen binnen-persoon verandering en causaliteit meten
- - We kunnen leeftijds, periode en cohort effecten verklaren
- Potentiele fouten:
- - Verloop (attrition): uitval van mensen, nonrespons in opeenvolgende rondes
- - Panel conditionering: leereffecten
Operationaliseren
- Om een theoretisch begrip te meten, moeten onderzoekers bepaalde stappen volgen:
- Theoretisch begrip conceptuele definitie operationele definitie variabele
Voordeel vragenlijst: er kunnen meerdere vragen gesteld kunnen worden over hetzelfde
onderwerp vragenlijst kan allerlei verschillende aspecten van theoretisch aspect
ondervragen
Itemscore: score op 1 vraag
Wat doet onderzoeker met dataset?
1. Coderen van de antwoorden: meestal met getalletjes van links naar rechts
2. Itemscores: bijv. wat is itemcore op vraag 2 etc.
3. Een variabele creeren
Doel: 1 score maken die ernst van bijv. PTSS aangeeft
Optie 1:
- Tel alle itemscores bij elkaar op
- 12 items, itemscore tussen de 1 en 4 schaalscores tussen de 12 en de 48
- Maar er zijn vaak nonresponsen en dan kan je die mensen niet meetellen
Optie 2:
- Bereken het gemiddelde van alle itemscores
2
, - Dit kan ook berekend worden met een paar missende waarden
Optie 3:
- Gewogen gemiddelde van itemscores: bepaalde vragen wegen zwaarder dan andere
vragen
Let op
- Een lage score zou ‘milde of geen van theoretisch begrip’ moeten betekenen
- Een hoge score zou ‘ernstige van theoretisch begrip’ moeten betekenen
- In veel vragenlijsten vinden we omgekeerd geformuleerde items
Omgekeerd geformuleerde items
- Hoge score betekent hoge bijv. PTSS
- Maar bij sommige items hoge score juist weinig PTSS: omgekeerd geformuleerde
items
- Reden: zodat mensen goed lezen en nadenken en bijv. niet makkelijk zeggen ik heb
geen PTSS dus ik doe alles 1: straight-lining
- Vallen op bij de antwoorden data set en bij gemiddelden per vraag descriptive
statistics
Wat te doen?
- Omgekeerd geformuleerde items moeten omgekeerd worden gecodeerd:
hercoderen, ompolen
- 14, 23, 32, 41
Dit is stap 1 in mogelijk maken om variabele te creeren, voorbereiden van de data
Bij beschrijvende statistiek frequentie tabel controle of omkeren is gelukt
Schaalscores berekenen
- Als alle items op juiste manier gecodeert zijn, dan kan schaalscore berekent worden
- Met de omgepoolde items kan nu een schaalscore worden berekened
- We gaan kijken naar of de som of de gemiddelde van al die items
- PTSS schaalscore, variabele berekenen = gemiddelde over alle items per persoon
(omgepoolde items worden gebruikt)
- Hieruit komen per persoon getallen en dat zijn de PTSS scores die we gaan gebruiken
als variabele om PTSS mee te meten
Goed verschil weten tussen schaalscore en itemscore
Met beschrijvende statistiek van schaalscore kun je minimum en maximun gegeven
antwoord etc. zien je kan met deze variabele ook grafieken maken, correlaties met andere
variabele berekenen, kijken of verschillen zijn tussen verschillende groepen etc.
Schaalscore vormt die variabele aan het einde van operationalisatie proces
3
, HC2 - Correlationeel II
Hoe weten we of een meetinstrument een goed instrument is?
- Begripsvaliditeit
- Betrouwbaarheid
Betrouwbaarheid en validiteit
- Betrouwbare meting:
- - De meting varieert niet door kenmerken van de manier waarop je hebt gemeten of
het meetinstrument
- - AKA precisie, consistentie van de meting
- - Voorbeeld: een weegschaal in de badkamer moet hetzelfde gewicht aangeven als je
er twee keer op stapt
- Valide meting:
- - Hoe goed je meting overeenkomt met het theoretische begrip waarin je
geinteresseerd bent
- - AKA nauwkeurigheid, correctheid van de meting
(Begrips)validiteit
- Indruk: lijkt de meting in orde?
- Inhoud: meet het alle aspecten van het construct?
- Convergent: correleert het met een andere meting van hetzelfde construct?
- Divergent: correleert het niet met iets dat iets anders meet?
- Criterium: correleert het met een andere meting waarvan we weten dat de relatie er
is?
Sterkte relatie meten: correlatie
- We meten de sterkte van de relatie met een correlatie
- Een maat voor het meten van de sterkte en richting van een lineaire relatie tussen
twee interval/ratio variabelen
- Aangegeven met r
- Waarden tussen -1 en 1
- Correlatie kan ook gebruikt worden om validiteit te meten
Betrouwbaarheid
- Test-hertest: vragenlijst aan groep mensen op later moment zelfde vragenlijst aan
zelfde groep mensen
- Interbeoordelaar: vooral bij observaties, verschillende mensen observeren hetzelfde
- Interne: wordt gemeten door cronbachs alfa
Betrouwbaarheid: hoe te meten zonder herhaalde metingen
- Cronbach’s alpha
- Meet interne consistentie: in welke mate zijn de items in een vragenlijst met elkaar
gecorreleerd
- Complexe berekeningen computer
- Hoe beter al die items met elkaar overeenkomen, hoe hoger die waarde
4