Moore, McCabe & Craig hoofdstuk 1
Statistiek is de wetenschap die het leren en conclusies trekken door middel van data omvat.
Data zijn beschrijvingen van de objecten die we willen bestuderen.
Data bestaat uit:
- Cases/units: worden door de dataset beschreven. Bijvoorbeeld klanten, bedrijven. Als
cases mensen zijn, dan wordt het subjects genoemd.
- Variabelen: eigenschappen van cases. Bijvoorbeeld leeftijd, gender, IQ.
o Categorische/kwalitatieve variabelen: plaatst elke case in een groep. Dit kan
nominaal (gender, etniciteit zonder volgorde) en ordinaal (lengte, scholing
wel een volgorde). Labels zijn de mogelijke waarden.
o Kwantitatieve variabelen: variabelen zijn nummers en hebben zo waarde. Dit
kan interval (IQ score, graden celsius 0 punt is niet absoluut) en kan ratio
(gewicht, lengte wel absoluut 0 punt) zijn. Moeten wel dezelfde unit of
measurement hebben. Dus alles in seconden en niet sommige in seconden
en sommige in minuten.
Karakteristieken van een dataset:
- Wie? Welke cases en hoeveel cases?
- Wat? Hoe veel variabelen zijn er en hoe zijn deze variabelen gedefinieerd?
- Waarom? Welk doel heeft de data? Beschrijft de data de informatie die we nodig
hebben?
De verdeling van de variabelen wordt in grafieken gedaan. Zo heb je een cirkeldiagram
(moet altijd 100% zijn) en een staafdiagram voor categorische variabelen, en een histogram
en boomdiagram voor kwantitatieve variabelen.
Eens boomdiagram kan je:
- Trimmen: van 140 en 143 allebei 140 maken en dit dan in een boomdiagram zetten
als ipv 3
- Splitten: als je veel waarden in de tien hebt, kun de tien opsplitsen in 0 tot 5 en 6 tot
10.
Ook kan een boomdiagram back to back zijn. Dit gebruik je als je twee gerelateerde
distributies in één boomdiagram weer wilt geven.
Om een grafiek te analyseren kijk je naar de vorm/patroon, middelpunt en spreiding. Door de
spreiding kun je ook outliers benoemen.
Er zijn verschillende distributies:
- Unimodale distributie: met één top skewed to the right
- Symmetrische verdeling: is gelijk verdeeld spiegelbeeld, normale verdeling.