Statistiek 1
Samenvatting
, Les 1
Populatie & steekproef
o Populatie = alles
o Steekproef = een deel van het geheel
Een populatie meten heeft niet altijd zin, bij genoeg metingen zit je al zo dicht bij
het gemiddelde dat de rest niet nodig meer is.
Aan welke eisen dient een steekproef te voldoen?
o De steekproef moet representatief zijn voor de volledige batch.
Centrummaten & spreidingsmaten
o Modus = Het getal wat het meeste voorkomt in een bepaalde dataset.
Komen alle getallen maar 1 keer voor dan is er geen modus
o Mediaan = het midden van een bepaalde dataset
Een mediaan kan soms een betere representatie geven van wat het gemiddelde
is, dit komt doordat het gemiddelde veel gevoeliger is voor een uitschieter dan
de mediaan.
o Standaarddeviatie (s) = maat voor de afwijking van alle waarden t.o.v. het
gemiddelde
o Variantie (s2) = bereken je door kwadraat te berekenen vd afwijkingen van
alle waarden t.o.v. het gemiddelde optellen en delen door het aantal
metingen -1
Hoe hoger de variantie, hoe groter de spreiding
o Standaarddeviatie = de wortel van de variantie
o Spreidingsmaten = variatie coëfficiënt = STEDV / gem.
doe dit keer 100 en je weet je spreidings%
o Met behulp van de variatie coëfficiënt kun je snel zien tussen 2
verschillende steekproeven waar de variatie het hoogst is.
Histogram
Stappenplan
1) Bepaal minimum en maximum
2) Bepaal bereik (max-min)
3) Bepaal aantal waarnemingen
4) Bepaal aantal klassen (zie vuistregel)
5) Bepaal de eindwaarde van elke klasse
6) Tel hoeveel waarnemingen in elke klasse en maak een grafiek
Aantal metingen Aantal klassen Klassenbreedte
N < 40 6 W/6
40 < n > 400
√n W/ n√
N > 400 20 W / 20
o Eindwaarde = eerste klasse is minimum + klassebreedte ;
Eindwaarde volgende klasse eindwaarde vorige klasse + klassebreedte
Samenvatting
, Les 1
Populatie & steekproef
o Populatie = alles
o Steekproef = een deel van het geheel
Een populatie meten heeft niet altijd zin, bij genoeg metingen zit je al zo dicht bij
het gemiddelde dat de rest niet nodig meer is.
Aan welke eisen dient een steekproef te voldoen?
o De steekproef moet representatief zijn voor de volledige batch.
Centrummaten & spreidingsmaten
o Modus = Het getal wat het meeste voorkomt in een bepaalde dataset.
Komen alle getallen maar 1 keer voor dan is er geen modus
o Mediaan = het midden van een bepaalde dataset
Een mediaan kan soms een betere representatie geven van wat het gemiddelde
is, dit komt doordat het gemiddelde veel gevoeliger is voor een uitschieter dan
de mediaan.
o Standaarddeviatie (s) = maat voor de afwijking van alle waarden t.o.v. het
gemiddelde
o Variantie (s2) = bereken je door kwadraat te berekenen vd afwijkingen van
alle waarden t.o.v. het gemiddelde optellen en delen door het aantal
metingen -1
Hoe hoger de variantie, hoe groter de spreiding
o Standaarddeviatie = de wortel van de variantie
o Spreidingsmaten = variatie coëfficiënt = STEDV / gem.
doe dit keer 100 en je weet je spreidings%
o Met behulp van de variatie coëfficiënt kun je snel zien tussen 2
verschillende steekproeven waar de variatie het hoogst is.
Histogram
Stappenplan
1) Bepaal minimum en maximum
2) Bepaal bereik (max-min)
3) Bepaal aantal waarnemingen
4) Bepaal aantal klassen (zie vuistregel)
5) Bepaal de eindwaarde van elke klasse
6) Tel hoeveel waarnemingen in elke klasse en maak een grafiek
Aantal metingen Aantal klassen Klassenbreedte
N < 40 6 W/6
40 < n > 400
√n W/ n√
N > 400 20 W / 20
o Eindwaarde = eerste klasse is minimum + klassebreedte ;
Eindwaarde volgende klasse eindwaarde vorige klasse + klassebreedte