STAOP samenvatting
Week 1
Variabelen
Variabelen = alles wat in een onderzoek gemeten, uitgevraagd of bijgehouden wordt zijn variabelen.
(de woorden in tabel) Een variabele is een eigenschap die verschillende waarden heeft voor
verschillende individuen, zoals leeftijd of geslacht
Informatie wordt ook wel data genoemd.
Een dataset bevat informatie over alle participanten en alle variabelen. (gehele tabel)
Een dataset (gehele tabel) ziet er als volgt uit: op elke rij staat een participant, dus het aantal rijen
staat gelijk aan het aantal participanten in het onderzoek. Elke kolom staat voor een variabele.
Meetniveaus
Je kunt alle variabelen verdelen in twee soorten:
Categorische variabelen (gemeten in groepen/categorieën)
1) Nominaal zijn een kwalitatieve classificatie zonder ordening (waardes alleen een naam
geven)
2) Ordinaal zijn een kwalitatieve classificatie met een logische ordening.
Continue variabelen (gemeten op een schaal)
1) Interval worden gemeten op een numerieke schaal. Interval variabelen zijn dus continue
variabelen. Interval variabelen hebben geen absoluut nulpunt, zelfs als de waarde 0 is.
2) Ratio zijn numerieke schalen en daarom continu. Ratio variabelen hebben een absoluut
nulpunt, waarbij een waarde van 0 het echte minimum is (intervallen tussen datapunten
gelijk)
Gemiddelde
Bij Interval- of Ratio data is het niet handig om de Modus uit te rekenen. Alle waardes zijn vaak net
anders, dus komt er geen één waarde het meeste voor.
Bij Interval- of Ratio data rekenen we daarom vaak het gemiddelde uit.
Gemiddelde berekenen door:
Een waarde wordt aangegeven met X (observatie)
Als je de som van iets neemt, gebruik je de Griekse hoofdletter Sigma Σ
Het aantal waardes is n
De gemiddelde waarde geef je aan door een streepje boven de waarde te zetten X met -
erboven
Soms wordt het gemiddelde ook weergegeven met de Griekse letter μ
gemiddelde ( μ)=
∑ (X)
n
Het gemiddelde kan alleen uitgerekend worden voor interval/ratio data.
, Modus
Het is niet zo moeilijk om de Modus te vinden:
Tel hoe vaak elke waarde voorkomt.
De waarde die het meeste voorkomt is de Modus.
Komen er twee waardes even vaak voor? Dan zijn er twee 'modi'.
De Modus berekenen voor Continue data heeft daarom vaak niet zoveel zin. Je gebruikt de Modus
vooral bij Categorische data.
Mediaan
De Mediaan is de middelste waarde.
Je vindt de Mediaan in vier stappen:
1. Zet alle waardes op volgorde van klein naar groot.
2. Tel hoeveel waardes er totaal zijn.
3. Deel het totaal aantal waardes door twee en rond af naar boven.
4. Tel vanaf het begin tot aan het getal uit stap 3 om zo de middelste waarde te vinden.
De Mediaan is dus altijd de middelste waarde.
Bij een oneven aantal waarden is dat de waarde in het midden.
Bij een even aantal waarden is de middelste waarde het gemiddelde van de middelste twee
waarden.
Frequentietabel
Hoe vaak bepaalde waardes voorkomen noemen we Frequentie. Zo'n tabel noemen we daarom een
frequentietabel
Bij het opstellen en aflezen van frequentietabellen zijn er vier begrippen van belang:
1. Absolute frequentie = het aantal keer dat iets voorkomt.
2. Relatieve frequentie = het aantal keer dat iets voorkomt uitgedrukt als percentage, oftewel:
relatief ten opzichte van het totaal aantal keren.
3. Geldige frequentie = Je kunt de relatieve frequentie dan berekenen ten opzichte van
iedereen die je de enquête hebt gestuurd, of ten opzichte van iedereen die een geldig
antwoord in heeft gevuld.
4. Cumulatieve frequentie = Hierbij tel je de relatieve frequentie (percentage) van een groep
op bij de percentages van de voorgaande groepen.
5. Relatieve geldige frequentie = het percentage van de antwoorden die zijn ingevuld
Staafdiagram
Het voordeel van de staafdiagram is dat je meteen ziet:
welke groepen de hoogste en laagste frequentie hebben
de verhoudingen goed te zien zijn.
Staan de staven los van elkaar
De staafdiagram gebruik je daarom vooral bij variabelen op nominaal of ordinaal niveau
Geclusterde staafdiagrammen
Een geclusterd staafdiagram is eigenlijk gewoon twee staafdiagrammen gecombineerd in een
plaatje
Minstens een van de variabele moet op nominaal of ordinaal niveau zijn
Week 1
Variabelen
Variabelen = alles wat in een onderzoek gemeten, uitgevraagd of bijgehouden wordt zijn variabelen.
(de woorden in tabel) Een variabele is een eigenschap die verschillende waarden heeft voor
verschillende individuen, zoals leeftijd of geslacht
Informatie wordt ook wel data genoemd.
Een dataset bevat informatie over alle participanten en alle variabelen. (gehele tabel)
Een dataset (gehele tabel) ziet er als volgt uit: op elke rij staat een participant, dus het aantal rijen
staat gelijk aan het aantal participanten in het onderzoek. Elke kolom staat voor een variabele.
Meetniveaus
Je kunt alle variabelen verdelen in twee soorten:
Categorische variabelen (gemeten in groepen/categorieën)
1) Nominaal zijn een kwalitatieve classificatie zonder ordening (waardes alleen een naam
geven)
2) Ordinaal zijn een kwalitatieve classificatie met een logische ordening.
Continue variabelen (gemeten op een schaal)
1) Interval worden gemeten op een numerieke schaal. Interval variabelen zijn dus continue
variabelen. Interval variabelen hebben geen absoluut nulpunt, zelfs als de waarde 0 is.
2) Ratio zijn numerieke schalen en daarom continu. Ratio variabelen hebben een absoluut
nulpunt, waarbij een waarde van 0 het echte minimum is (intervallen tussen datapunten
gelijk)
Gemiddelde
Bij Interval- of Ratio data is het niet handig om de Modus uit te rekenen. Alle waardes zijn vaak net
anders, dus komt er geen één waarde het meeste voor.
Bij Interval- of Ratio data rekenen we daarom vaak het gemiddelde uit.
Gemiddelde berekenen door:
Een waarde wordt aangegeven met X (observatie)
Als je de som van iets neemt, gebruik je de Griekse hoofdletter Sigma Σ
Het aantal waardes is n
De gemiddelde waarde geef je aan door een streepje boven de waarde te zetten X met -
erboven
Soms wordt het gemiddelde ook weergegeven met de Griekse letter μ
gemiddelde ( μ)=
∑ (X)
n
Het gemiddelde kan alleen uitgerekend worden voor interval/ratio data.
, Modus
Het is niet zo moeilijk om de Modus te vinden:
Tel hoe vaak elke waarde voorkomt.
De waarde die het meeste voorkomt is de Modus.
Komen er twee waardes even vaak voor? Dan zijn er twee 'modi'.
De Modus berekenen voor Continue data heeft daarom vaak niet zoveel zin. Je gebruikt de Modus
vooral bij Categorische data.
Mediaan
De Mediaan is de middelste waarde.
Je vindt de Mediaan in vier stappen:
1. Zet alle waardes op volgorde van klein naar groot.
2. Tel hoeveel waardes er totaal zijn.
3. Deel het totaal aantal waardes door twee en rond af naar boven.
4. Tel vanaf het begin tot aan het getal uit stap 3 om zo de middelste waarde te vinden.
De Mediaan is dus altijd de middelste waarde.
Bij een oneven aantal waarden is dat de waarde in het midden.
Bij een even aantal waarden is de middelste waarde het gemiddelde van de middelste twee
waarden.
Frequentietabel
Hoe vaak bepaalde waardes voorkomen noemen we Frequentie. Zo'n tabel noemen we daarom een
frequentietabel
Bij het opstellen en aflezen van frequentietabellen zijn er vier begrippen van belang:
1. Absolute frequentie = het aantal keer dat iets voorkomt.
2. Relatieve frequentie = het aantal keer dat iets voorkomt uitgedrukt als percentage, oftewel:
relatief ten opzichte van het totaal aantal keren.
3. Geldige frequentie = Je kunt de relatieve frequentie dan berekenen ten opzichte van
iedereen die je de enquête hebt gestuurd, of ten opzichte van iedereen die een geldig
antwoord in heeft gevuld.
4. Cumulatieve frequentie = Hierbij tel je de relatieve frequentie (percentage) van een groep
op bij de percentages van de voorgaande groepen.
5. Relatieve geldige frequentie = het percentage van de antwoorden die zijn ingevuld
Staafdiagram
Het voordeel van de staafdiagram is dat je meteen ziet:
welke groepen de hoogste en laagste frequentie hebben
de verhoudingen goed te zien zijn.
Staan de staven los van elkaar
De staafdiagram gebruik je daarom vooral bij variabelen op nominaal of ordinaal niveau
Geclusterde staafdiagrammen
Een geclusterd staafdiagram is eigenlijk gewoon twee staafdiagrammen gecombineerd in een
plaatje
Minstens een van de variabele moet op nominaal of ordinaal niveau zijn