Hoofdstuk 1: Introduction to Statistics
De term statistiek wordt gebruikt om te verwijzen naar methoden voor het organiseren,
samenvatten en interpreteren van gegevens.
Wetenschappelijke vragen hebben doorgaans betrekking op een populatie, dat wil zeggen
de gehele groep individuen die men wil bestuderen. Meestal zijn populaties zo groot dat het
onmogelijk is om elk individu te onderzoeken. Daarom wordt het meeste onderzoek
uitgevoerd met steekproeven. Een steekproef is een groep die uit een populatie wordt
geselecteerd, meestal met het oog op een onderzoek.
Een kenmerk dat een steekproef beschrijft, wordt een statistiek genoemd, en een kenmerk
dat een populatie beschrijft, wordt een parameter genoemd. Hoewel steekproefstatistieken
doorgaans representatief zijn voor overeenkomstige populatieparameters, bestaat er
doorgaans enige discrepantie tussen een statistiek en een parameter. Het natuurlijk
voorkomende verschil tussen een statistiek en een parameter wordt de steekproeffout
genoemd.
Statistische methoden kunnen in twee brede categorieën worden ingedeeld: beschrijvende
statistieken, die gegevens ordenen en samenvatten, en inferentiële statistieken, die
steekproefgegevens gebruiken om conclusies te trekken over populaties.
De correlatiemethode onderzoekt relaties tussen variabelen door voor elk individu twee
verschillende variabelen te meten. Met deze methode kunnen onderzoekers relaties meten
en beschrijven, maar kunnen ze geen oorzaak-en-gevolg-verklaring voor de relatie geven.
De experimentele methode onderzoekt relaties tussen variabelen door een onafhankelijke
variabele te manipuleren om verschillende behandelingsomstandigheden te creëren en
vervolgens een afhankelijke variabele te meten om een groep scores in elke aandoening te
verkrijgen. Vervolgens worden de groepen scores met elkaar vergeleken. Een systematisch
verschil tussen groepen levert bewijs dat het veranderen van de onafhankelijke variabele
van de ene toestand naar de andere ook een verandering in de afhankelijke variabele
veroorzaakte. Alle andere variabelen worden gecontroleerd om te voorkomen dat ze de
relatie beïnvloeden. De bedoeling van de experimentele methode is om een oorzaak-
gevolgrelatie tussen variabelen aan te tonen.
Niet-experimentele studies onderzoeken ook relaties tussen variabelen door groepen scores
te vergelijken, maar ze hebben niet de nauwkeurigheid van echte experimenten en kunnen
geen oorzaak-en-gevolg-verklaringen produceren. In plaats van een variabele te
manipuleren om verschillende groepen te creëren, maakt een niet-experimenteel onderzoek
gebruik van een al bestaand deelnemerskenmerk (zoals man/vrouw) of het verstrijken van
de tijd (voor/na) om de groepen te creëren die worden vergeleken.
,Een meetschaal bestaat uit een reeks categorieën die wordt gebruikt om individuen te
classificeren. Een nominale schaal bestaat uit categorieën die alleen in naam verschillen en
niet gedifferentieerd zijn in termen van omvang of richting.
Ezelsbruggetje = Noir (er komt elke keer een regel bij)
Een discrete variabele bestaat uit ondeelbare categorieën, vaak hele getallen die in telbare
stappen variëren (bijvoorbeeld het aantal kinderen in een gezin). Een continue variabele
bestaat uit categorieën die oneindig deelbaar zijn en elke score komt overeen met een
interval op de schaal (bijvoorbeeld lengte, gewicht en temperatuur). De grenzen die
intervallen scheiden, worden echte limieten (real limits) genoemd en bevinden zich precies
halverwege tussen aangrenzende scores.
De letter X wordt gebruikt om scores voor een variabele weer te geven. Als een tweede
variabele wordt gebruikt, vertegenwoordigt Y de scores ervan. De letter N wordt gebruikt als
symbool voor het aantal scores in een populatie; n is het symbool voor een aantal scores in
een steekproef.
De Griekse letter sigma (Σ) wordt gebruikt om sommatie aan te duiden. Daarom wordt de
uitdrukking ΣX gelezen als ‘de som van de scores’. Optelling is een wiskundige bewerking
(zoals optellen of vermenigvuldigen) en moet op de juiste plaats in de volgorde van de
bewerkingen worden uitgevoerd; Optelling vindt plaats nadat haakjes, exponenten en
vermenigvuldigen/delen zijn voltooid.
,
, Hoofdstuk 2: Frequency Distributions
Het doel van beschrijvende statistiek is het vereenvoudigen van de organisatie en
presentatie van gegevens.
Eén beschrijvende techniek is om de gegevens in een frequentieverdelingstabel of -grafiek te
plaatsen, die precies laat zien hoeveel individuen (of scores) zich in elke categorie op de
meetschaal bevinden.
Een frequentieverdelingstabel vermeldt in één kolom de categorieën waaruit de meetschaal
bestaat (de X-waarden). Naast elke X-waarde staat in een tweede kolom de frequentie of het
aantal individuen in die categorie. De tabel kan een verhoudingskolom bevatten die de
relatieve frequentie voor elke categorie weergeeft:
De tabel kan een percentagekolom bevatten die het percentage weergeeft dat aan elke X-
waarde is gekoppeld:
Het wordt aanbevolen om een frequentieverdelingstabel te gebruiken.
Zorg voor een maximum van 10-15 rijen om het simpel te houden. Als de scores een bereik
bestrijken dat breder is dan dit voorgestelde maximum, is het gebruikelijk om het bereik te
verdelen in secties die klasse-intervallen worden genoemd. Deze intervallen worden
vervolgens vermeld in de frequentieverdelingstabel, samen met de frequentie of het aantal
individuen met scores in elk interval. Het resultaat wordt een gegroepeerde
frequentieverdeling genoemd. De richtlijnen voor het samenstellen van een gegroepeerde
frequentieverdelingstabel zijn als volgt:
A. Er moeten ongeveer 10 intervallen zijn.
B. De breedte van elk interval moet een eenvoudig getal zijn (bijvoorbeeld 2, 5 of 10).
C. De onderste score in elk interval moet een veelvoud van de breedte zijn.
D. Alle intervallen moeten dezelfde breedte hebben en moeten het bereik van de scores
bestrijken, zonder gaten.