Hoorcollege 1 Correlationeel: Survey-onderzoek
Manieren van generaliseren van correlationele data verzameling:
Incidenteel: AKA organic (ready made)
- Aspirational: (facebook, Twitter, Instagram) data die sowieso al geproduceerd worden.
- Transactional: wat gebeurt er met je bankkaart, creditcard etc. of gegeven van
energiemaatschappijen. Bonuskaart.
Opzettelijk: AKA designed (custom made)
- Experimenteel
- Survey: enquetes/vragenlijsten
- Administratieve: zoals belastingdienst
In dit blokje gaan we het hebben over Surveys/Vragenlijsten bij dataverzameling.
Conclusies trekken en terugkoppelen naar de hele populaties= inferentie. Waarom doen we dat: de
werkelijkheid beschrijven; beschrijvende statistiek, relaties beschrijven, generaliseren, causaliteit.
Doelen voor de inferentiele data:
- Beschrijven
- Causaliteit (oorzaak van verandering in populaties etc.)
- Prediction (voorspellen)
OEFENING: onderzoek over Wat is de mening van mannen met dochters over gelijktrekken van mannen-
vrouwen. Dit is Causaliteit (want het gaat om de vraag komt het door het feit dat de mannen een dochter
hebben dat ze anders denken over de rol van de man-vrouwen?).
Methoden
- Face to face (CAPI)
- Telephone (CATI)
- Internet
- Mixed-mode (combinatie van 2 studies)
Verschillen tussen verschillende methode
- Bemoeienis van de interviewer (Face to face veel en internet niks)
- Interactie met respondent (telefoon, face to face meer)
- Privacy (anoniemer bij computer)
- Hoe communiceren met de persoon die vragenlijst invult (kan je een plaatje laten zien, dat kan niet bij
telefoon oid. Maar internet weer wel) en auditatief: kan je geluidsopname maken, dat kan bij telefoon
maar niet bij vragenlijst.
- Technologie gebruik.
Voor en nadelen
,Survey modes in NL
- Population register & over 90% internet use
- Mode mixes (zoals bij internetvragenlijst dat ze aanpassen op telefoonversie dus een vraag per keer in
plaats van 10 per pagina zoals op de computer).
- Marktonderzoekers maken gebruik van zowel kans- als onwaarschijnlijkheidspanels
- Mixed-device survey (computer/smartphone)
Types van mixed-mode design
- Een methode voor respondenten, andere methode voor andere respondenten
De antwoorden kunnen namelijk methode afhankelijk zijn. Face to face is misschien anders dan bij een
internetvragenlijst anoniem. Dus dan is het handig om dat op te vangen door beide te gebruiken.
- De ene methode om mensen te winnen en de andere methode om het onderzoek af te nemen (mail voor
interventie en een online survey voor het onderzoek)
- De ene methode voor data verzamelen en de andere methode voor reminders etc.
- Twee methodes binnen 1 vragenlijst: gevoelige onderwerpen doen ze misschien niet face to face maar
online of vragenlijst etc.
Cross-selectional and panel surveys
- Panel surveys: onderzoekers volgen mensen door de tijd heen. Inhoud is meestal hetzelfde, maar kan
verschillen.
Voordelen:
1. Verandering over de tijd beschrijven.
2. Maar als je het maar 1 keer vraagt weet je niet wat het effect is van achtergrond factoren en als je
die wilt meenemen dan is een panel goed. (Zoals anders bij vrijgezelle moeders dan bij getrouwde
moeders).
Nadelen:
1. Attrition (uitval) door bijvoorbeeld geen zin meer etc. of wave-nonresponse. Als je dan een
vragenlijst stuurt en hij wel weer meedoet na een tijdje niet).
2. Panel conditioning (AKA learning effects); op een gegeven moment weet je wat je antwoord was
en ga je weer hetzelfde antwoord geven en ga je niet meer zelf te raden wat het antwoord zou
moeten zijn.
Eén methode voor één wave van het panelonderzoek en een andere methode voor een andere wave van het
panel onderzoek.
De ene keer pen en papier en de andere keer ook en de derde keer via internet. Dan heb je nog een nieuwe
vorm van een mixed-mode design.
Voorbeeld zomertijd.
- De redenen waren gek.
- Het grote probleem: niet representatief.
- Het idee: we willen weten over de mening over de zomertijd etc. en bij het onderzoeksontwerp ga je
kijken; bij wie en hoe ga je meten. Daar ging het fout. Bij de survey lifecycle hebben we 2 kanten; het
meetinstrument (links); conceptueel en operationeel, en aan de andere kant representatie (rechts); de
mensen.
, 1. Coverage error =Dekkingsfout
- Als ze niet overeenkomen met je doelpopulatie (mensen die meer of minder kans maken dat ze in je
onderzoek terecht komen)
- Het speelt pas een rol als mensen die niet in jouw lijst zijn ANDERS zijn dan de mensen van je
lijst/doelpopulatie. Dan is het problematisch. (voorbeeld college: als ik geintereseerd ben hoe groot jullie
voeten zijn dan krijg ik een gemiddelde maar mensen die niet aanwezig zijn zitten niet in je
steekproefkader maar is dat erg? Nee want ze hebben niet systematisch anders dan degene die er wel zijn)
- Twee soorten dekkingsfouten: Onder- en overschatting wat niet op de lijst staat maar wel in de
populatie zit = onderschatting en degene die wel op de lijst staan maar niet in de populatie is
overschatting.
2. Sampling error = steekproeffout
- Komt eigenlijk altijd voor. Hoe groot je je steekproef ook maakt. Want wat er in de steekproef gebeurt is
nooit hetzelfde als in de totale populatie. Maar wanneer wordt een steekproeffout belangrijk? Als je de
steekproef te klein maakt en als je geen aselecte steekproef trekt. Die foutmarge is een maat om die
onzekerheid aan te geven. Bij surveys is het vaak genoeg met een foutmarge met 3 percentage punten
(binnen 3% van de waarheid). Vaak iets meer dan 1000 personen nodig.
3. Non-respons error = non-respons fout
Respondenten vallen uit (attrition). Mensen gaan bepaalde vragen niet antwoorden, door de lengte
bijvoorbeeld. Deze fout vindt plaats als mensen die geselecteerd zijn geen antwoord geven. Het wordt pas
een probleem als de mensen die niet antwoorden anders zijn dan mensen die wel antwoorden.
Er zijn twee verschillende soorten non respons:
- Unit-nonrespons als mensen weigeren mee te doen.