H OO F D ST U K 1 G ATH E R I N G AND E XP LO R I N G D ATA
Statistiek Wetenschap die bestaat uit :
- Samenstellen van steekproeven en verzamelen van gegevens
- Ordenen en aanschouwelijk maken van gegevens
- Berekenen van statistische maten
- Toetsen van betrouwbaarheid van de resultaten voor volledige populatie
Waarom?
Om bestaand onderzoek te begrijpen
Om je eigen onderzoek te kunnen uitvoeren
Empirische cyclus : Probleemstelling Onderzoeksdesign Data verzamelen Data analyseren
Interpretatie
Descriptive Statistics (Beschrijvende statistieken): Samenvatten van de verzamelde data. De
samenvattingen bestaan gewoonlijk uit grafieken en cijfers zoals gemiddelden en percentages.
Inferential Statistics: Verwijst naar methoden om beslissingen of voorspellingen over een bevolking te
maken, gebaseerd op gegevens verkregen uit een steekproef van de populatie.
Parameter: Is een numerieke samenvatting van de populatie
Statistiek: Is een numerieke samenvatting van de steekproef uit de populatie
Approximate margin of error : Is een statistiek die de hoeveelheid random steekproeffouten uit het
resultaat berekent. Hoe groter de margin of error, hoe minder vertrouwen in de resultaten.
Formule :
1
, H OO FSTU K 2 E X P LO R I N G D ATA WI T H G R A PH S A N D NU M M E R I C A L
SU M M A R I ES
Categoriaal : als elke observatie behoort tot een uitzonderlijke categorie
Kwantitatief: als observaties numerieke waarden aannemen, die verschillende maten van de variabele
vertegenwoordigen.
Populatie (total set of subjects) : de gehele groep waarvan men een bepaalde eigenschap wilt
bestuderen
Steekproef: een deel van de populatie waar men het onderzoek uitvoert
Variabele: het onderwerp van het onderzoek / de eigenschap
Data/ gegeven: de waarde van de variabele
Soorten variabele:
Kwalitatief: Nominaal Geen natuurlijke rangorde
Ordinaal Natuurlijke rangorde
Kwantitatief: Discreet Resultaat van een telling
Continu Resultaat van een meting
Ratio Nul = 0
Interval Nulpunt kunstmatig gekozen
Distributie van een variabele beschrijft de verdeling van de variabele. Hoe de observaties worden
verdeeld.
Representatieve
steekproef : Als alle doelgroepen van de populatie in de juiste verhouding opgenomen zijn en als de
steekproef voldoende groot is.
Randomisatie: Iedere respondent heeft evenveel kans om in de steekproef te belanden Kleinere
kans op ongelijke verdeling/ verstorende kenmerken.
Frequentie tabel
- Absolute frequentie : Het aantal gegevens die gelijk zijn aan de waarde
- Relatieve frequentie : Absolute frequentie/totaal aantal
- Absolute cumulatieve frequentie: Aantal gegevens die kleiner of gelijk aan die waarden zijn.
(1e freq + 2e freq, 2e freq + 3e freq, 3e freq + 4e freq.
- Relatieve cumulatieve frequentie: Cumulatieve frequentie / aantal gegevens
2