Onderscheid tussen variabele en waarde:
Variabele = een eigenschap of kenmerk van een respondent. Bijvoorbeeld leefijd en
geslacht.
Waarde= de inhoud van een variabele. Bijvoorbeeld 17 jaar, man.
Kolomsgewijs analyseren = variabelen analyseren en de cases als dragers van kenmerken
beschouwen die verder niet afzonderlijk worden geanalyseerd.
2 keuzes die samen een typologie opleveren:
1. Volledig beschrijven vs zinvol samenvaten (met parameter, kengetal, statstc = reducte van
data door coondensatee
2. Numeriek vs visueel
Dus:
Beschrijven vs reductie
- Beschrijven: sorteren en tellen
- Reducte: condenseren, samenvaten tot één kerngetal
Numeriek vs visueel
- Numeriek: getalsmatg
- Visueel: grafieken
Numeriek Visueel
Beschrijving Frequentetabel Grafieken
Reductie Statstcs Box-and-whisker plot
Verschil proporte, percentage en rato:
1. Proportie = het aantal cases in een categorie gedeeld door het totale aantal cases.
2. Percentage =het aantal cases relatef ten opzichte van het totale aantal cases.
3. Ratio = het aantal cases in een categorie gedeeld door het aantal cases in een andere
categorie.
In plaats van het presenteren van een tabel met alle gesorteerde en gepresenteerde scores of een
grafiek daarvan, kunnen we de waarden van een variabele ook samenvaten in één of enkele:
- Kengetallen
- Statstcs
- Parameters
2 categorieën kengetallen:
1. Maten voor het centrum (het zwaartepunt van alle waardene
2. Maten voor de spreiding van alle waarden.
Om deze uit te voeren moet je leten op een geschikt meetniveau!
Meetniveaus:
1. Nominaal bv. landen, geslacht, religie, kranten
De enige relate tussen de getallen die hier gebruikt worden, is dat de verschillende getallen
verschillend zijn. Dat betekent dat het alleen mogelijk is aan te geven in hoeverre onderzoek
elementen t.a.v. de variabele verschillend dan wel gelijkwaardig zijn.
, 2. Ordinaal bv. onderwijsniveau
Hier gebruiken we van getallen niet alleen het kenmerk dat ze verschillen, maar ook dat van
twee verschillende getallen het ene getal groter is dan het andere getal. We kunnen ze
rangschikken in volgorde van groote, maar meer niet.
3. Interval temperatuur
We gebruiken nu niet alleen dat getallen verschillen en dat ze naar groote geordend kunnen
worden, maar ook dat de verschillen telkens twee getallen (intervallene naar groote
geordend kunnen worden.
4. Ratio leefijd, lengte
Alle kenmerken van getallen kunnen worden gebruikt. Er is rangorde, er zijn gelijke
afstanden en er is een absoluut nulpunt.
Omdat we op hogere meetniveaus meer met de getallen mogen doen, kunnen we daar dus
krachtger kengetallen definiëren.
De belangrijkste centrummaten zijn:
Modus
Nominaal- of hoger meetniveau
= de meest voorkomende waarde of categorie. Komen er meer waarden het vaakste voor,
dan spreekt men van een multmodale variabele. Bij twee hoogste waarden spreekt men van
een bimodale variabele. Omdat de modus niet teruggrijpt op eigenschappen van getallen,
kan deze maat op elk meetniveau worden gebruikt.
Mediaan
Ordinaal- of hoger meetniveau
= de middelste score. Dus de waarden kunnen naar groote worden geordend. Als er een
even aantal waarden zijn, dan is er dus niet één middelste, maar dan nemen we de waarde
die precies tussen de twee middelste waarden in ligt.
Een percentiel is de kleinste waarde waaronder een bepaald percentage van de waarden
valt.
Deciel: 10 % van alle waarden ligt daaronder
Kwartel: 25 % van alle waarden lig daaronder
2e kwartel = mediaan
De mediaan is niet erg gevoelig voor extreme waarden.
Gemiddelde
Interval/rato meetniveau
= de som van alle waarden, gedeeld door het aantal waarden.
Het gemiddelde is gevoelig voor extreme waarden.
Gemiddelde vergeleken met mediaan:
- Informaterijker
- Gevoeliger voor extreme waarden
- Minder variant bij herhaalde steekproefrekking
- Geschikter voor rekenkundige bewerking
- Gedefinieerd op interval niveau
Spreidingsmaten
Op nominaal en ordinaal meetniveau is afstand tussen de waarden niet gedefinieerd. Alle zinnige
spreidingsmaten maken daarom gebruik van interval/rato eigenschappen en kunnen op de lagere
meetniveaus niet worden gebruikt. Op interval/rato niveau zijn een aantal spreidingsmaten
gedefinieerd:
Range
De range is het verschil tussen de hoogste en de laagste waarde.