Les 1:
Variabele = een eigenschap die kan variëren. Bijvoorbeeld:
lengte, leeftijd, haarkleur, batchnummer… etc
Data = gevonden/gemeten waarden voor een variabele
Je hebt twee verschillende soorten data: Kwalitatieve vs Kwantitatieve data
- Kwalitatieve data, zijn geen getallen. Bijvoorbeeld een naam
- Kwantitatieve data, zijn getallen.
o Discrete variabelen: dingen die je kunt tellen, hele getallen.
o Continue data: dingen die je niet kunt tellen en willekeurig zijn.
Data die verzameld wordt kan gecategoriseerd worden in de volgende meetniveaus:
- Nominaal: Afzonderlijke categorieën. Geen rangschikking, bijvoorbeeld haarkleur, nationaliteit.
- Ordinaal: onderlinge volgorde. Bijvoorbeeld kledingmaten.
- Interval: Gelijke afstanden. Bijvoorbeeld temperatuur
- Ratio: absoluut nulpunt. Bijvoorbeeld gewicht, lengte. De waarde 0 betekent dat er niets is.
Frequentieverdelingen:
Staafdiagram: geschikt voor kwalitatieve data. De hoogte van een balk is gelijk aan het
aantal metingen in de meetcategorie. Voor nominale data maakt volgorde van balken
niet uit. Voor ordinale data is er wel een logische volgorde.
Histogram: geschikt voor kwantitatieve data. De hoogte van een balk is gelijk aan het
aantal metingen op het interval onder de balk. Altijd een logische volgorde van links
naar rechts, want de x-as is een getallenlijn.
Verdelingsvormen
Je kunt bij een histogram de globale verdeling tekenen om de balken heen. De vorm van de
rode lijn beschrijft de verdeling van de meetwaarden. Er zijn een paar vormen voor die rode
lijn die veel voorkomen. We bespreken hier symmetrische, uniforme, links-scheve en rechts-
scheve verdelingen.
- Symmetrische verdelingen: de linker en rechterzijde van de verdelingen zijn elkaars
spiegelbeeld
- Uniforme verdelingen: alle gemeten waarden treden even waak op. Uniforme verdelingen
zijn altijd symmetrisch.
- Rechts-scheve: de staart van de verdeling ligt aan de rechterkant. We meten een groot
aantal lege waarden en een klein aantal hoge waarden.
- Links-scheve: De staart van de verdeling ligt aan de linker kant. We
meten een groot aantal hoge waarden en een klein aantal lege
waarden.
, Statistiek
Les 2:
Er zijn drie standaardmanier om het centrum te berekenen:
1. De modus, is het meest voorkomende waarde in jouw metingen. Bijvoorbeeld de piek van een grafiek.
2. De mediaan, de middelste waarde als je al je metingen op volgorde van klein naar groot hebt gezet.
3. Het gemiddelde, som van de metingen gedeeld door het aantal meetingen
Er zijn verschillende manieren, om de variabiliteit van meetingen te analyseren:
1. Spreidingsbreedte, is het verschil tussen de hoogste en de laagste meetwaarde
(spreidingsbreedte = Range = xmax – xmin). Hoe groter de spreidingsbreedte, hoe groter de variatie in je
meetwaarden.
2. Variantie (S2), het verschil tussen het gemiddelde en ieder meetpunt. Hoe groter deze verschillen, hoe groter
de variabiliteit in je meetwaarden. Het ‘gemiddelde’ verschil noemen we de variantie.
3. Standaardafwijking, bij de berekening van de variantie worden de eenheden van de metingen
gekwadrateerd. Dus als de metingen in meters zijn, dan is de eenheid de variantie vierkante-meters (m2). Om
dit te voorkomen trekken wij de wortel uit de variantie en verkrijggen op die manier de standaardafwijking.
Les 3:
Kwantielen: de grenswaarden van een set gegevens die je in gelijke delen verdeeld zodat elk deel hetzelfde aantal
waarden bevat.