Hoorcolleges TOE : correlationeel
HC1
In correlationeel onderzoek:
- Kwantitatief
- Relaties tussen variabelen
- In het echte leven (bv. via survey)
- Causaal onderzoek is moeilijk (want vele andere factoren, geen manipulatie)
Voorbeelden: buttons op vliegveld (☹ 😊), CBS etc.
Correlationele data groeit exponentieel, want digitalisering: door devices kan je gedragspatronen
zien.
Data verzameling: kwantitatieve data
Designed data = (custommade) de onderzoeker heeft goed
nagedacht over hoe het onderzoeksproces eruit zou gaan
zien.
Organic data = (readymade: ‘ligt klaar om geanalyseerd te
worden) verzameld in natuurlijke omgeving van mensen, niet
gestructureerd. Je kan hierbij denken aan ‘Big data’. Hier
wordt dus niet nagedacht over verzamel proces, maar juist
wel erna; de analyse wordt echt goed uitgedacht.
- Aspirationele data: wat mensen posten op bv. facebook/instagram, dit verzamelen en
analyseren.
- Transactionale data: wanneer mensen betalen met pinpas, bonuskaart gebruiken = data
punt.
- Administratieve data ( =belastingdienst heeft info over iedereen) is ook deels organic!
Correlationele data (designed)
wordt verzameld om populatie/doelgroep te onderzoeken.
beschrijven van sociale realiteit
onderzoeken van causale relaties
generaliseren naar doelpopulatie
DUS: hypothese steekproef data verzamelen conclusies trekken generaliseren =
INFERENTIE.
Doelen van inferentie
Beschrijving
Causaliteit
Voorspelling
Survey Lifecycle
Representation side (vertegenwoordiging van populatie)
, 1. doelpopulatie definiëren
2. Sampling frame: bron van waaruit onderzoeker steekproef kan vormen. bv. lijst van alle mogelijke
participanten contacten wel responderende/niet responderende.
3. Steekproef (gevormd vanuit sampling frame)
4. Respondenten
5. Postsurvey aanpassingen: bv. afwegen van factoren etc.
5. Survey statistic
Measurement side (metingen)
1. Construct:
2. Meting: het operationaliseren van constructs zodat participanten ze begrijpen. Als mensen liegen
dat ze vraag bekijken = measurement error
3. Respons: het stellen van de vragen aan respondenten. (deel antwoord, deel niet: problemen)
4. Edited response: bv bij mailquestionnaires: iemand heeft vraag niet geantwoord/veranderd dan
moet onderzoeker het goed coderen in software. COding error
5. Survey statistic
Bij elke stap is er kans om fouten te maken! Antwoorden op onderzoeksvraag zullen biased/niet
accuraat zijn als er verschillende errors zijn die zich hebben opgestapeld onderweg (tijdens lifecycle).
Coverage error: wanneer deel die gedekt zijn,
en deel dat niet gedekt is van elkaar verschillen. Deze fout komt voor wanneer: (1) als niet
alle leden van populatie een bekende, nonzero kans hebben om in steekproef te komen (2)
als de mensen die wel in de steekproef zitten verschillen van zij die niet in steekproef zitten.
Dus opletten of hele populatie bereikt kan worden. Twee mogelijkheden:
undercoverage(=wanneer deel niet op lijst staan maar wel vallen onder doelpopulatie) en
overcoverage (= wanneer deel wel op lijst staat maar niet valt onder doelpopulatie).
Sampling error komt voor wanneer (1) maar een deel, ipv alle, leden van gedekte populatie
survey kunnen maken (2) onzekerheid (mate van error is marge van onzekerheid)(3) we
hebben statistieken nodig om onzekerheid te berekenen
: bv. wanneer je via online panel data verzameld, weet je niet precies wie het invullen en
weet je dus ook niet waarnaar je kan generaliseren
- Je kan niet generaliseren als je een non-probability sample gebruikt (bv. open survey). Hier
komt coverage error bij als het online is: alleen internet gebruikers kunnnen deelnemen (only
survey): open online survey.
Nonresponse error komt voor wanneer de mensen die geselecteerd zijn voor een survey die
niet reageren verschillen (in relevante variabelen: nuttig voor onderzoeksvraag uitkomst)
van mensen die wel reageren. Verschillende types:
- Unit-nonresponse = mensen die wel geselecteerd zijn maar helemaal niet mee willen doen
(ze negeren de request volledig)
- Item-nonresponse = mensen die wel geselecteerd zijn, meedoen, maar bepaalde vragen niet
beantwoorden.
HC1
In correlationeel onderzoek:
- Kwantitatief
- Relaties tussen variabelen
- In het echte leven (bv. via survey)
- Causaal onderzoek is moeilijk (want vele andere factoren, geen manipulatie)
Voorbeelden: buttons op vliegveld (☹ 😊), CBS etc.
Correlationele data groeit exponentieel, want digitalisering: door devices kan je gedragspatronen
zien.
Data verzameling: kwantitatieve data
Designed data = (custommade) de onderzoeker heeft goed
nagedacht over hoe het onderzoeksproces eruit zou gaan
zien.
Organic data = (readymade: ‘ligt klaar om geanalyseerd te
worden) verzameld in natuurlijke omgeving van mensen, niet
gestructureerd. Je kan hierbij denken aan ‘Big data’. Hier
wordt dus niet nagedacht over verzamel proces, maar juist
wel erna; de analyse wordt echt goed uitgedacht.
- Aspirationele data: wat mensen posten op bv. facebook/instagram, dit verzamelen en
analyseren.
- Transactionale data: wanneer mensen betalen met pinpas, bonuskaart gebruiken = data
punt.
- Administratieve data ( =belastingdienst heeft info over iedereen) is ook deels organic!
Correlationele data (designed)
wordt verzameld om populatie/doelgroep te onderzoeken.
beschrijven van sociale realiteit
onderzoeken van causale relaties
generaliseren naar doelpopulatie
DUS: hypothese steekproef data verzamelen conclusies trekken generaliseren =
INFERENTIE.
Doelen van inferentie
Beschrijving
Causaliteit
Voorspelling
Survey Lifecycle
Representation side (vertegenwoordiging van populatie)
, 1. doelpopulatie definiëren
2. Sampling frame: bron van waaruit onderzoeker steekproef kan vormen. bv. lijst van alle mogelijke
participanten contacten wel responderende/niet responderende.
3. Steekproef (gevormd vanuit sampling frame)
4. Respondenten
5. Postsurvey aanpassingen: bv. afwegen van factoren etc.
5. Survey statistic
Measurement side (metingen)
1. Construct:
2. Meting: het operationaliseren van constructs zodat participanten ze begrijpen. Als mensen liegen
dat ze vraag bekijken = measurement error
3. Respons: het stellen van de vragen aan respondenten. (deel antwoord, deel niet: problemen)
4. Edited response: bv bij mailquestionnaires: iemand heeft vraag niet geantwoord/veranderd dan
moet onderzoeker het goed coderen in software. COding error
5. Survey statistic
Bij elke stap is er kans om fouten te maken! Antwoorden op onderzoeksvraag zullen biased/niet
accuraat zijn als er verschillende errors zijn die zich hebben opgestapeld onderweg (tijdens lifecycle).
Coverage error: wanneer deel die gedekt zijn,
en deel dat niet gedekt is van elkaar verschillen. Deze fout komt voor wanneer: (1) als niet
alle leden van populatie een bekende, nonzero kans hebben om in steekproef te komen (2)
als de mensen die wel in de steekproef zitten verschillen van zij die niet in steekproef zitten.
Dus opletten of hele populatie bereikt kan worden. Twee mogelijkheden:
undercoverage(=wanneer deel niet op lijst staan maar wel vallen onder doelpopulatie) en
overcoverage (= wanneer deel wel op lijst staat maar niet valt onder doelpopulatie).
Sampling error komt voor wanneer (1) maar een deel, ipv alle, leden van gedekte populatie
survey kunnen maken (2) onzekerheid (mate van error is marge van onzekerheid)(3) we
hebben statistieken nodig om onzekerheid te berekenen
: bv. wanneer je via online panel data verzameld, weet je niet precies wie het invullen en
weet je dus ook niet waarnaar je kan generaliseren
- Je kan niet generaliseren als je een non-probability sample gebruikt (bv. open survey). Hier
komt coverage error bij als het online is: alleen internet gebruikers kunnnen deelnemen (only
survey): open online survey.
Nonresponse error komt voor wanneer de mensen die geselecteerd zijn voor een survey die
niet reageren verschillen (in relevante variabelen: nuttig voor onderzoeksvraag uitkomst)
van mensen die wel reageren. Verschillende types:
- Unit-nonresponse = mensen die wel geselecteerd zijn maar helemaal niet mee willen doen
(ze negeren de request volledig)
- Item-nonresponse = mensen die wel geselecteerd zijn, meedoen, maar bepaalde vragen niet
beantwoorden.