Moore, McCabe & Graig hoofdstuk 3
Er zijn verschillende soorten data:
- Anecdotal data: representeert individuele data, ze zijn niet representatief voor een
grotere groep. Het is niet bij voorbaat slecht.
- Available data: data is al verzameld voor andere doeleinden. Deze kunnen alsnog
gebruikt worden voor een onderzoek.
Er zijn ook verschillende manieren om data te verzamelen:
- Sample studies: en groep mensen representeert een grotere populatie. Bij census
doe je een poging om alle mensen te bereiken in een populatie.
- Observationele studies: je meet de variabelen door te observeren, zonder invloed uit
te oefenen op de respons.
- Experiment: je legt opzettelijk een treatment op individuen. Bij de interventie kijk je of
er iets veranderd als je een element in een experiment verandert. enige bron van
overtuigende data over oorzaak-gevolg relaties.
Experimental units zijn individuen of dingen op wie de studie is gedaan. Als de units mensen
zijn dan praten we over subjects. Om de treatments te vergelijken, moet je de outcomes
(gemeten variabelen) vergelijken.
Er zijn drie basisprincipes met betrekking tot het design van onderzoek in statistiek:
- Comparison: vergelijkt meerdere variabelen met elkaar. Het elimineert het placebo
effect en de confounding factoren mensen reageren hoe het verwacht wordt op
persoonlijke aandacht. Dit kan de resultaten beïnvloeden. Een controle groep is van
belang. Een probleem dat nog wel bestaat is bias: een studie is biased als een
bepaalde uitkomst voorkeur krijgt.
- Randomization: je gebruikt willekeurigheid om units in groepen te delen. Dit zorgt
ervoor dat je geen bias hebt.
- Repeat: je herhaalt het experiment op veel units om te zorgen dat je kans variatie
kleiner wordt.
Een experiment heeft een ideale situatie als een studie double-blind is. De subjects en
experimentoren weten niet welke treatment een subject heeft. Hierdoor geen bias. Het
grootste risico bij een experiment is lack of realism: de units of subjects vertegenwoordigen
de realiteit niet goed. Om dit te voorkomen kun je gebruik maken van matched pair designs:
de subjects zijn gematcht en lijken dus op elkaar. Beide blocks krijgen een andere treatment
en zo heb je een betrouwbaarder resultaat. Het kan ook zijn dat beide treatments op
dezelfde persoon gedaan wordt en dan heet het cross-over.
Een sample is een deel van een populatie. De proportie van een sample waaruit nuttige
informatie is verkregen noemen we response rate.
Er zijn verschillende soorten samples:
- Voluntary response sample: mensen reageren op een vrijwillige oproep grote kans
op bias omdat alleen mensen met sterke meningen meedoen.