Les 1
Populatie
de volledige verzameling van waardes waarvan we iets willen weten
(bv alle mannen op de wereld, alle Jumbo’s, alle studenten etc)
Gemiddelde populatie= µ
SD populatie= σ
Steekproef
een deel van de volledige verzameling van waardes waarvan je iet wilt weten. Wordt
gebruikt als het niet mogelijk is om alle waardes van de populatie te verzamelen.
Gemiddelde steekproef= X̄
SD steekproef= S
Centrummaten
Gemiddelde=
som van alle waardes/ het aantal waardes
Σ xi
µ/ X̄ =
n
Modus =
de meest voorkomende waarde.
Mediaan=
De middelste waarde in een reeks; zet de waardes op volgorde van klein naar groot
& de middelste waarde is de mediaan.
Spreidingsmaten
Standaarddeviatie=
De gemiddelde afwijking ten opzichte van het gemiddelde (s of σ)
S= √alle waardes-gemiddelde2 / (aantal waardes -1)
Variantie=
Een andere maat voor de afwijking ten opzichte van het gemiddelde (s2 of σ2)
, Variatiecoëfficient=
een manier om de spreiding aan te geven.
De variatiecoëfficient is dimensieloos en kan goed gebruikt worden om verschillende
variabelen te vergelijken. Vooral als waardes sterk uiteenlopen.
Uitbijters
Waardes die afwijken van de reeks
Manieren om uitbijters te testen zijn;
Dixon’s Q;
Q=
¿ suspect−nearest ∨ ¿ ¿
largest−smallest
Q= (verwachte uitbijter - waarde die het meest dichtbij ligt) /
(laagste- hoogste)
Vergelijk berekende waarde met tabelwaarde;
Als Qberekend > Qtabel: dan is het en uitbijter
Grubb’s G
¿
G = ¿ suspect−x́∨ s ¿
G= verachte uitbijter- gemiddelde / standaarddeviatie
Vergelijk berekende waarde met tabelwaarde;
Als Gberekend > Gtabel: dan is het en uitbijter
Histogram
= frequentietabel.
Wordt gebruikt om veel data overzichtelijk weer te
geven.
Eisen histogram;
Y-as het aantal keer dat een meetwaarde heeft
plaatsgevonden
X-as aantal klassen
Klassebreedte: breedte van elke klasse. Wordt bepaald dmv;
maximum- minimum / totaal aantal klassen
N<40 6 klasse
40 < N <400 √n klasse
400 <N 20 klasse
Tenzij een ander aantal klasse logischer is.