Leerdoelen W1
De DIO kan beschrijvend resultaten rapporteren en presenteren
De DIO kan resultaten weergeven in grafieken, tabellen en diagrammen
Onderzoeksvaardigheden
Hoofdstuk 8 Beschrijven van variabelen
Paragraaf 8.1. Inleiding statistiek
Beschrijvende statistiek beschrijft de populatie in overzichtelijke tabellen, grafieken en figuren.
Laat zien hoe de populatie eruitziet.
Met inductieve statistiek probeer je door middel van een steekproef informatie te krijgen over de hele
populatie van je onderzoek. Methoden van inductieve statistiek zijn toetsen als de chi-kwadraat en
schattingsmethoden als de binomiale verdeling.
Bij exploratieve statistiek gaan we uit van voorhanden zijnde data, dus niet van een steekproef.
Op deze bestaande data kun je inductieve en beschrijvende statistiek toepassen.
Paragraaf 8.2. Datamatrix
Je kwantitatieve onderzoek heeft veel data (ingevulde enquêtes) opgeleverd en je wilt hierover
uitspraken doen. Met de datamatrix kun je de resultaten analyseren.
Om de data van je onderzoek te kunnen analyseren, moet je de antwoorden zoveel mogelijk
cijfermatig coderen. Voordat je start met het coderen van de antwoorden, maak je een codeboek.
In het codeboek zet je alle vragen met bijbehorende antwoordcategorieën plus hun codes.
Iedere vraag geef je een variabelennaam, een soort afkorting waaraan je de vraag herkent. Per vraag
geef je aan welk antwoord welke code heeft.
Als je een codeboek hebt gemaakt, kun je alle data in één bestand zetten: de datamatrix.
Een datamatrix moet voldoen aan de volgende eisen:
- Per rij (van links naar rechts) staan de scores van één enquête of object
- Per kolom (van onder naar boven) staan de scores voor één variabele
- In een datamatrix staan alle gegevens die tijdens het onderzoek zijn verzameld. Deze
gegevens kunnen bestaan uit zowel getallen als woorden (bij open vragen). Op een lege
plaats zet je een punt; daarmee geef je aan dat er geen antwoord is gegeven op deze vraag.
- Bij vragen waarop meerdere antwoorden mogelijk zijn, worden meerdere kolommen gebruikt
(per antwoord één).
- Je geeft iedere afgenomen enquête een respondentnummer. Een respondentnummer is een
uniek nummer. Als je in de datamatrix een antwoord ziet waaraan je twijfelt, kun je met het
respondentnummer snel de enquête raadplegen.
Paragraaf 8.3. Frequentieverdeling en grafieken
Frequentieverdeling
De frequentie is het aantal keren dat een verschijnsel voorkomt.
Het doel van de frequentieverdeling is om de resultaten van het onderzoek overzichtelijk weer te
geven.
Ongegroepeerde frequentieverdeling
Een ongegroepeerde frequentieverdeling wordt gebruikt wanneer van een variabele slechts weinig
waarden voorkomen.
Voorbeeld ongegroepeerde frequentieverdeling propedeusestudenten heao
Leeftijd studenten Aantal
17 jaar 5
18 jaar 11
Totaal 16
Gegroepeerde frequentieverdeling
Als een variabele veel voorkomende waarden heeft en de waarden in groepen kan worden ingedeeld,
ligt het voor de hand om te kiezen voor een gegroepeerde frequentieverdeling.
Bij een gegroepeerde frequentieverdeling zet je de frequentie van een groep in een tabel. De
frequentie van een groep of klasse is het totaal van de frequenties van de afzonderlijke waarden die
tot een bepaalde klasse behoren.
Voorbeeld gegroepeerde frequentieverdeling leeftijd van grote groep mensen in supermarkt
1
, Leeftijd Aantal
0-9 jaar 5
10-19 jaar 16
20-29 jaar 23
30-39 jaar 22
40-49 jaar 34
50-59 jaar 23
60+ jaar 27
Totaal 150
Relatieve frequentieverdeling
Als je groepen wilt vergelijken, kun je de relatieve frequentieverdeling nemen. Bij een relatieve
frequentieverdeling laat je de frequenties van verschillende klassen als een percentage zien.
Bij de weergave van je onderzoeksresultaten maak je zoveel mogelijk gebruik van deze relatieve
frequentieverdeling en grafieken. De frequentieverdeling heeft als voordeel dat de informatiedichtheid
groot kan zijn, zodat je in een beperkte ruimte meerdere vragen kunt behandelen.
Bij lage aantallen kun je vanwege de betrouwbaarheid niet met percentages werken vanaf n (aantal
respondenten) = 100 kan dat wel. Soms wil je toch met percentages werken voor de
overzichtelijkheid, hoewel n eigenlijk laag is. In dat geval moet je er een waarschuwing bij zetten: je
moet geen nauwkeurigheid suggereren die er niet is. Onder n= 50 is het gebruik van percentages
sterk af te raden. Bij een lage n (kleiner dan 200) rond je de uitkomst altijd af op hele percentages. Bij
een grotere n is het zelden zinvol om meer dan één cijfer achter de komma te vermelden.
Voorbeeld relatieve frequentieverdeling leeftijd van grote groep mensen in een supermarkt
Leeftijd Aantal %
0-9 jaar 5 3
10-19 jaar 16 11
20-29 jaar 23 15
30-39 jaar 22 15
40-49 jaar 34 23
50-59 jaar 23 15
60+ jaar 27 18
Totaal 150 100
Cumulatieve frequentieverdeling
Een cumulatieve frequentieverdeling geeft het totale aantal frequenties weer dat zich onder een
bepaalde klassengrens bevindt. Je telt als het ware de frequenties tot dan toe bij elkaar op. Je doet dit
om te weten welk deel van een verdeling onder een bepaalde waarde ligt. De meting moet wel op
minstens ordinaal niveau zijn. Je zet de vragen in de rijen en de antwoordmogelijkheden in de
kolommen van een tabel.
Voorbeeld cumulatieve frequentieverdeling leeftijd van grote groep mensen in een supermarkt
Leeftijd Aantal Cumulatief aantal
0-9 jaar 5 5
10-19 jaar 16 21
20-29 jaar 23 44
30-39 jaar 22 66
40-49 jaar 34 100
50-59 jaar 23 123
60+ jaar 27 150
Totaal 150
Ook is het mogelijk een kruistabel te maken, waarin meerdere variabelen tegenover elkaar staan.
Door de resultaten in een kruistabel te zetten, wordt het verband tussen de variabelen zichtbaar.
De onafhankelijke variabele zet je in de kolommen, de afhankelijke in de rijen. Verticaal percenteer je
tot 100%, zodat je gemakkelijk kunt vergelijken. Daarna kun je met een chi-kwadraattoets onderzoek
of het verband tussen de variabele significant is.
Voorbeeld kruistabel haarlengte en geslacht
Haarlengte Geslacht Totaal
Man Vrouw
Kort haar 120 (60%) 30 (20%) 150 (43%)
Middellang haar 70 (35%) 75 (50%) 145 (41%)
Lang haar 10 (5%) 45 (30%) 55 (16%)
Totaal 200 (100%) 150 (100%) 350 (100%)
2