H1: Statistische basisbegrippen
1.1 Beschrijvende en inductieve statistiek
• twee soorten statistiek
↪ Beschrijvende statistiek: ordenen, presenteren en interpreteren van gegevens door middel van
tabellen, grafieken en statistische maten (doe je altijd)
↪ Frequentietabel: soort turftabel, waarin voor alle verzamelde gegevens wordt aangegeven
hoe vaak ze voorkomen
↪ Statistische maten: kengetallen
↪ Centrummaten: geven middelpunt van gegevens aan. Bekendste: rekenkundig
gemiddelde
↪ Spreidingsmaten: geven beeld van verdeling van gegevens.
↪ Standaarddeviatie: maat voor afwijking van de gegevens ten opzichte van
gemiddelde
↪ Scheefheidsmaten: over de vorm van de verdeling (symmetrisch of niet?)
↪ Statistische samenhang: samenhang tussen variabelen of verschillen tussen groepen (b.v.
is er verschil tussen schoolcijfers bij mannen en vrouwen d.m.v. kruistabel)
↪ Inductieve statistiek: alleen toegepast als we te maken hebben met een steekproef
↪ Steekproef: wanneer onderzoeksgroep / populatie te groot is om in geheel te onderzoeken
↪ d.m.v. statistische toetsing wordt nagegaan of steekproefuitkomsten geldig zijn voor hele
populatie (significant) (kansen worden berekend)
↪ Betrouwbaarheidsinterval: het gebied waarin geschat wordt waartussen het echte
rekenkundig gemiddelde (of een andere statistische maat) ligt
• populatie en steekproef
↪ Populatie: onderzoeksgroep met één / meer gemeenschappelijke kenmerken (b.v álle Utrechtse
studenten) → vaak te groot om in geheel te onderzoeken of kennen populatie niet → kunnen
populatie als geheel dus niet onderzoeken → steekproef
↪ Steekproef: gedeelte van populatie (wanneer gehele populatie te groot/onbekend is)
↪ Aselecte steekproef → representatief; goede afspiegeling populatie. Eenheden
random/aselect gekozen (iedereen gelijke kans om getrokken te worden). Steekproef
voldoende groot
↪ Steekproefkader nodig; lijst met alle eenheden van populatie (b.v. alle bedrijven)
↪ Gerichte/niet-kanssteekproef: onderzoekseenheden worden op basis van
beschikbaarheid of willekeur gekozen, zoals bij een passantenonderzoek
↪ geen steekproefkader, vormen geen representatieve afspiegeling van populatie
1.2 Datamatrix: Onderzoekseenheden en variabelen
• Datamatrix: (rechthoekige tabel) weergave verzamelde onderzoeksgegevens. Bestaat uit:
↪ Onderzoekseenheden/cases: groep waarover in het onderzoek uitspraak wordt gedaan. B.v.
personen, huishoudens, bedrijven, organisaties of geografische eenheden (landen, steden)
↪ Variabelen: kenmerken of eigenschappen van de onderzoekseenheden
↪ kwalitatief: categorieën, geen meeteenheden, b.v geslacht, opleidingsniveau, huishtype
↪ kwantitatief: numerieke gegevens (getallen), b.v. leeftijd, huurprijs, aantal kinderen
↪ Waarden / scores: mogelijke uitkomsten van een variabele. Als er gegevens ontbreken worden dat
missing values genoemd (staan in cellen datamatrix)
↪ altijd titel (tabel 1.1) en bronvermelding
1