WHY IS MY EVIL LECTURER FORCING ME TO LEARN STATISTICS?
Om interessante vragen te beantwoorden heb je data nodig en een verklaring voor die data.
kwantitatieve methoden: als nummers/cijfers betrokken zijn bij het onderzoek.
kwalitatieve methoden: als er geen nummers betrokken zijn.
Het onderzoeksproces
Observatie die je wil begrijpen (kan anekdoten zijn of gebaseerd op data) genereert theorieën voor die
observaties daaruit maak je voorspellingen (hypothesen) verzamelen van relevante data analyseren
van de data.
Om data te verzamelen, moet je een of meer variabelen definiëren die je wil meten.
falsificatie: het weerleggen van een hypothese of een theorie.
1.5: collecting data to test your theory
Als we gegevens willen verzamelen is het belangrijk dat we ons twee dingen afvragen: (1) wat wordt er
gemeten en (2) hoe wordt het gemeten.
Om de hypothesen te kunnen testen moeten we variabelen meten. Variabelen zijn dingen die kunnen variëren,
tussen mensen, of tussen situaties of in de loop van de tijd. Bij de meeste hypothesen heb je twee variabelen,
de oorzaak en de uitkomst.
De variabele die we zien als de oorzaak wordt de onafhankelijke variabele of predictor genoemd. Bij een
experimentele opzet wordt deze term gebruikt om te benadrukken dat de onderzoeker deze variabele
gemanipuleerd heeft.
De variabele die verandert door veranderingen in de onafhankelijke variabele wordt de afhankelijke variabele
of uitkomst variabele genoemd.
Levels of Measurement
Variabelen kunnen op verschillende manieren gemeten worden. Het verband tussen wat je meet en de cijfers
die uitdrukken wat je meet, noem je het meetniveau. Variabelen kunnen categorisch of continu zijn.
Een categorische variabele bestaat uit verschillende categorieën. Je kan maar in één categorie per keer
ingedeeld worden, je hoort niet een beetje bij de ene categorie en een beetje bij de andere categorie.
binaire variabele is een variabele waarbij er maar twee categorieën zijn, zoals sekse.
Als een variabele bestaat uit meer dan twee categorieën die aan elkaar gelijk zijn, noem je dit een nominale
variabele. Een voorbeeld van een nominale variabele is religie (jodendom, christendom, islam, et cetera).
Hoewel deze categorieën ook kunnen worden weergegeven met cijfers, is het niet mogelijk om wiskundige
berekeningen uit te voeren met deze cijfers. Deze cijfers geven namelijk niet een rangorde aan bij een
nominale variabele. Een voorbeeld van een nominale variabele die wordt weergegeven met cijfers is het
rugnummer van een speler in een teamsport. Een hoger rugnummer betekent niet dat iemand een betere
speler is. Nominale data kan alleen gebruikt worden om te kijken naar frequenties, dus hoe vaak een bepaalde
speler scoort, of hoeveel mensen een bepaald geloof hebben.
Bij een ordinale variabele heb je ook verschillende categorieën, maar hebben die een bepaalde rangorde.
Ordinale data geeft bijvoorbeeld een bepaalde volgorde aan. Echter wordt er niet aangegeven hoe groot het
verschil is tussen de categorieën. Een top drie van een wedstrijd geeft aan wie beter is dan de ander, dus het
heeft een volgorde, maar het zegt niet hoeveel beter de winnaar was dan de nummer twee en drie.
Bij het volgende meetniveau heb je geen categorische variabele meer, maar is de variabele continu. Een
continue variabele is een score die elke waarde kan aannemen die op de meetschaal wordt gebruikt. De
intervalvariabele is een vorm van een continue variabele. Bij de intervalvariabele is het verschil tussen alle
getallen gelijk. Een voorbeeld hiervan is een schaal waarbij je aangeeft hoe aardig je iemand vindt op een
vijfpuntsschaal. Het verschil tussen 1 en 2 is hierbij even groot als het verschil tussen 4 en 5. Dit meetniveau
wordt het meest gebruikt bij statistische testen.
Nog een stap verder is de ratio variabele. De ratio variabele heeft dezelfde voorwaarden als de
intervalvariabele alleen heeft de ratio variabele een absoluut en betekenisvol nulpunt. Dit betekent dat je de