College 1 – Hoofdstuk 2
De leer van statistiek kan verdeeld worden in:
o beschrijvende statistiek is een samenvatting van verkregen data. Inferentiele
statistiek is het maken van voorspellingen op basis van je bevindingen.
o Bovendien kan beschrijvende statistiek ook weer in tweeën worden gedeeld: het kan
gaan om beschrijving van gegevens met één variabele, dat heet univariaat. Maar ook
de beschrijving van gegevens met meerdere variabelen, dat heet multivaraat.
Er zijn bovendien verschillende soorten variabelen:
o Categorische variabelen: hebben als waarden geen getallen maar kenmerken. De
waarde staat dus voor een bepaalde categorie. Bijv. leeftijd, geslacht, mate religie
etc.
Nominale variabelen: geen rangordening. Bijv. leeftijd, geslacht etc.
Ordinale variabelen: wel rangordening. Bijv. niet religieus – religieus – erg
religieus
o Kwantitatieve variabelen: hebben als waarden wel een getal. Bijv. lengte, gewicht
etc.
Discrete variabelen: slechts ronde getallen. Bijv. aantal kinderen, huisdieren
Continu variabelen: kunnen alles zijn. Bijv. lengte, gewicht, reisafstand
Bovendien kun je data op verschillende manieren presenteren:
o Categorische variabelen bijvoorbeeld door een frequentietabel, taartdiagram,
staafdiagram
o Kwantitatieve variabelen bijvoorbeeld door een histogram, dot plot, stem-and-leaf
plot
Er is verder een verschil tussen proportie en percentage. Een proportie ligt altijd tussen 0 en
1, terwijl een percentage altijd tussen 0 en 100 ligt.
Bij een boel verschillende waarnemingen kun je een bepaald patroon gaan ontdekken; de
data is op een bepaalde manier verdeeld. Die verdeling komt vaak mooi tot zijn recht in een
frequentietabel. Er zijn allereerst twee verschillende standaardverdelingen: unimodaal en
bimodaal. Ze zien er uit als onderstaand. Een voorbeeld van unimodaal is het meten van IQ,
een voorbeeld van een bimodaal is de lengte van een file door de dag heen
De leer van statistiek kan verdeeld worden in:
o beschrijvende statistiek is een samenvatting van verkregen data. Inferentiele
statistiek is het maken van voorspellingen op basis van je bevindingen.
o Bovendien kan beschrijvende statistiek ook weer in tweeën worden gedeeld: het kan
gaan om beschrijving van gegevens met één variabele, dat heet univariaat. Maar ook
de beschrijving van gegevens met meerdere variabelen, dat heet multivaraat.
Er zijn bovendien verschillende soorten variabelen:
o Categorische variabelen: hebben als waarden geen getallen maar kenmerken. De
waarde staat dus voor een bepaalde categorie. Bijv. leeftijd, geslacht, mate religie
etc.
Nominale variabelen: geen rangordening. Bijv. leeftijd, geslacht etc.
Ordinale variabelen: wel rangordening. Bijv. niet religieus – religieus – erg
religieus
o Kwantitatieve variabelen: hebben als waarden wel een getal. Bijv. lengte, gewicht
etc.
Discrete variabelen: slechts ronde getallen. Bijv. aantal kinderen, huisdieren
Continu variabelen: kunnen alles zijn. Bijv. lengte, gewicht, reisafstand
Bovendien kun je data op verschillende manieren presenteren:
o Categorische variabelen bijvoorbeeld door een frequentietabel, taartdiagram,
staafdiagram
o Kwantitatieve variabelen bijvoorbeeld door een histogram, dot plot, stem-and-leaf
plot
Er is verder een verschil tussen proportie en percentage. Een proportie ligt altijd tussen 0 en
1, terwijl een percentage altijd tussen 0 en 100 ligt.
Bij een boel verschillende waarnemingen kun je een bepaald patroon gaan ontdekken; de
data is op een bepaalde manier verdeeld. Die verdeling komt vaak mooi tot zijn recht in een
frequentietabel. Er zijn allereerst twee verschillende standaardverdelingen: unimodaal en
bimodaal. Ze zien er uit als onderstaand. Een voorbeeld van unimodaal is het meten van IQ,
een voorbeeld van een bimodaal is de lengte van een file door de dag heen