Rijksuniversiteit Groningen
Formules
, Formules voor statistiek
1. Mode (Modus)
Definitie: De meest voorkomende waarde in een dataset.
Toepassing: Vaak gebruikt om populaire of meest voorkomende
categorieën aan te geven.
Uitleg: In een dataset zoals {2, 3, 4, 4, 5}, is de modus 4 omdat
deze waarde het vaakst voorkomt.
2. Median (Mediaan)
Definitie: De middelste waarde in een geordende dataset; bij een
even aantal is het het gemiddelde van de twee middelste waarden
(formules voor n even en oneven).
Toepassing: Handig bij scheve datasets om een centrale tendens te
beschrijven zonder beïnvloeding van extreme waarden.
In een dataset zoals {3, 5, 7}, is de mediaan 5 (middelste waarde).
3. Mean (Gemiddelde)
Definitie: Het gemiddelde van alle waarden in een dataset,
berekend door alle waarden op te tellen en te delen door het aantal
waarden.
Toepassing: Geeft het centrale punt van de dataset aan, maar kan
worden beïnvloed door uitschieters.
4. Interquartile Range (IQR)
Definitie: Het verschil tussen het derde kwartiel (Q3) en het eerste
kwartiel (Q1); het meet de spreiding van de middelste 50% van de
data.
Toepassing: Gebruikt om de spreiding van de dataset te meten,
met minder gevoeligheid voor uitschieters.
5. Standard Deviation (Standaarddeviatie, steekproef)
Definitie: Een maat voor de spreiding van de data rondom het
gemiddelde, berekend als de wortel van de variantie.
Toepassing: Gebruikt om de mate van variatie of spreiding in een
dataset te beschrijven.
Uitleg: Dit is de wortel van de variantie, en het geeft aan hoe ver de
waarden gemiddeld afwijken van het gemiddelde.