Primary data collection = als onderzoekers hun eigen data collectie ontwerpen en uitdragen
Secondary data collection = gegevens verzameld door iemand anders
Surveys
Self-administered questionnaire (SAQ) = een survey gemaakt door respondenten door de mail of
online.
Data wordt op verschillende manieren verzameld:
- Incidentally onbewust organic
- Purposively bewust designed
Bij survey opzoek gaan naar antwoorden van respondenten.
Correlationele data (designed)
We maken een studie en verzamelen data om; Inferential goals:
- Werkelijkheid te beschrijven
- (Causale) verbanden te bestuderen*
- Generalisatie te maken over doelgroep
*Bij vragen over of één bepaald kenmerk een verandering in een ander kenmerk veroorzaakt,
spreken we over causaliteit. Bij causaliteit spreken we over onderzoeksvragen die een
oorzaak/gevolg verband beschrijven.
Voorwaarden causaliteit zijn:
1. Covariance (covariantie): er moet een relatie zijn tussen de oorzaak en het gevolg;
2. Temporal precedence (volgorde in tijd): de oorzaak moet in de tijd voorafgaan aan het gevolg;
3. Internal validity (interne validiteit): alternatieve verklaringen voor de gevonden relatie moeten
zijn uitgesloten.
Survey Modes (manieren van surveys)
- Face-to-face (CAPI = Computer Assisted Personalized Interview)
- Post
- Telephone (CATI = Computer Assisted Telephone Interview)
- Internet
- Mixed modes
- Mixed-device survey
o Computer/smartphone maakt verschil in manier van opstellen van de survey
Verschillen tussen modes
- Mate van betrokkenheid interviewer
- Mate van interactie met de respondent
- Mate van privacy
- Manier van communicatie
o Visueel
o Auditief
,- Gebruik van techniek
- Cross-sectional survey = een survey waarin data zijn verzameld op slechts één tijdspunt.
- Repeated cross-sectional survey = een type van longitudinale survey waarin data zijn verzameld
op verschillende tijden, maar van verschillende individuen op hetzelfde tijdspunt
- Panel survey = een type van longitudinale survey waarin data zijn verzameld van dezelfde
individuen op verschillende momenten
o Content vaak hetzelfde, maar kunnen verschillen
o Voordelen:
Toegang tot de verschillen binnen groepen
Sluit leeftijd, periode en cohort effecten uit groepen die iets delen.
o Potentiële errors:
Attrition = het verlies van een aantal deelnemers, meestal door dood of dropouts
Panel conditioning leer-effecten ze weten antwoorden al.
- Longitudinal survey = een survey waarin data zijn verzameld op meerdere tijden
- Poll = een erg korte, gericht op één onderwerp, survey
- Split-ballot design = een survey waarin een willekeurig geselecteerde subset van respondenten,
meestal 50% van de personen die zijn geselecteerd om deel te nemen aan de survey, één actuele
module ontvangt, terwijl de andere 50% een andere actuele stemming ontvangt
- Paradata = informatie over het proces van dataverzameling
Schaalscore vormen:
- Het optellen van scores levert een schaal op met hele getallen. Handig voor interpretatie. Nadeel
= respondenten met missende variabelen, krijgen geen schaalscore jammer, want je wil
analyses uitvoeren op een zo groot mogelijk databestand.
- Gemiddelde berekenen ook voor respondenten die een score missen. Nadeel = respondenten
die bijna niets hebben ingevuld, hun gemiddelde, hun schaalscore, eigenlijk niets zegt.
Correlationeel – problemen bij surveys
Problemen survey:
- Metingen zijn niet betrouwbaar
o ligt aan (niet goed) herinneringen ophalen recall bias
o ligt aan (niet goed) schatten
- Vragen hebben soms lage construct validiteit
Problemen lab:
- Mensen gedragen zich anders dan normaal = Hawthorne effect
- Slechts momentopnames
- Problemen met externe validiteit
Problemen foto’s:
- Wie doet/eet/etc. wat?
- Lage construct validiteit
- Lage betrouwbaarheid
, - Context wordt weggehaald
Problemen bijhouden/dagboek:
- Non-response effect
- Recall kunnen mensen nog herinneringen wat ze hebben gedaan? laag in betrouwbaarheid
- Under-reporting mensen hebben neiging niet de werkelijkheid aan te geven laag in
validiteit.
Problemen online dagboek:
- Kunnen mensen dit doen? coverage error
- Non-response effect
Problemen met metingen:
- Validiteit
o Construct validiteit
o Externe validiteit
Coverage
Non-response
Reactiviteit/Hawthorne effect
o Recall: under-reporting
- Betrouwbaarheid Problemen met recall
Welke metingen gebruiken waarvoor?:
- Feiten secondary data, specialist vragen
- Gedragingen observaties, persoon vragen
- Meningen persoon vragen
Vragen stellen d.m.v. surveys/vragenlijsten
Survey Lifecycle
Dekkingsfouten = een type fout dat plaatsvindt als de sample niet geen goede representatie is van de
doelgroep, door bijvoorbeeld systematisch meerdere uit te sluiten of juist toe te voegen.
Steekproeffouten = wanneer resultaten uit een steekproef gebruikt worden om iets te zeggen over
een populatie
Non-response error
- Unit-non-response gehele lijst niet beantwoorden
- Item-non-response een bepaalde vraag wordt niet beantwoord
Adjustment error:
- Door coverage en non-response, kunnen statistieken gebaseerd op respondent afwijken van de
doelpopulatie.
o Het ophogen van de onder gepresenteerde deel
o Non-response imputatie van vragen gok van invulling