Beschrijvende statistiek
, College 1
Leerdoelen
- Begrip van fundamentele bergippen
o Steekproef en populatie
o Variabele
o ‘Statistic’ (grootheid/statistiek) en parameter
o Beschrijvende en toetsbare statistiek
- Een passende centrummaat bij het type variabele kiezen en berekenen
- Data grafische weergeven op een manier die past bij het type variabelen
Steekproef zit in populatie
- Populatie te groot om volledig te onderzoeken, en niet allemaal
te bereiken
- Populatie: de totale verzameling van onderwerpen waarin we
geïnteresseerd zijn.
- Steekproef: een deelverzameling van de populatie waarvoor
we gegevens hebben (of van plan zijn te verzamelen), vaak
willekeurig geselecteerd.
- Met steekproef iets zeggen over de populatie
- Hoe goed kunnen nederlandse peuters tellen voordat zij naar de basisschool gaan?
o Steekproef: 52 drieëneenhalfjarige kinderen in NL
o Wat je onderzoekt taalvaardigheden
Variabelen
- Categorische variabele
o Nominaal bijv. Haar kleur, lievelingsfilm,
losstaande categorieen
o Ordinaal losstaande categorieën, maar wel
een orde aan te geven (zoals leeftijd, peuters,
tieners, ouderen); nummers hebben geen
betekenis (je kan nummer toekennen, maar
niet tellen)
- Kwantitatieve variabelen (nummers wel betekenis)
o Interval afstanden tussen getallen ‘kloppen’, gelijk, je kan er mee rekenen
en vergelijken.
Bijvoorbeeld graden Celsius
o Ratio absoluut nulpunt. Afwezigheid (bij 0 paar schoenen, zijn ze er
gewoon niet)
Bijvoorbeeld graden Kelvin absoluut nulpunt. Je kan niet minder
dan 0 hebben
o Discrete variabele hebben een vaste waarde en geen tussenwaarden, niet
teveel decimalen. Wordt gebruikt in sociale wetenschappen.
, o Continu variabele op een conitnuum, je zou oneindig door kunnen gaan,
bijvoorbeeld tijd op de nanoseconde specificeren en nooit afronden
Statistic (grootheid) en parameter
- Statistic steekproefwaarde
o Kan je altijd berekenen bij steekproef
o Specifieke data van een steekproef
- Parameter populatiewaarde
o Vaak schatten, want je niet alle waarden hebt van een populatie
o Numerieke samenvatting van de populatie
- Beschrijvende statistiek: data samenvatten en beschrijven van de steekproef
- Toetsende statistiek: wat in steekproef is gemeten of dat ook opgaat in de populatie
Redenen om statischtische methodes te gebruiken
- Design: het doel en/of de statistische vraag van belang/interesse formuleren en
plannen hoe gegevens kunnen worden verkregen om deze te beantwoorden.
- Beschrijven (description): samenvatten an analyseren van data dat is verkregen
- Conclusie (inference): beslissingen nemen en voorspellingen doen op basis van de
gegevens om de statistische vraag te beantwoorden
Beschrijvende statistiek voor één variabele
- Grafische weergave
- Centrummaten: waar zitten de meeste mensen
- Spreidingsmaten ( college 2): hoe verschillen de mensen van elkaar
- Vb. Hoe goed kunnen nederlandse peuters tellen voordat zij naar de basisschool
gaan?
o Variabelen: tellen van vijf blokes. Kan je het wel of kan je het niet?
o Correct or incorrect
Grafische weergave
Cirkeldiagram (pie chart) beschrijvende statstieken
categorische variabele
- Snel overzichtelijk
- De grootte van een deel komt overeen met het
percentage waarnemingen in de categorie
Staafdiagram (barplot/ bar graph) hoogte blokjes met
nummers (bij voorbeeld peuters)
- Inzicht in waar meer participanten op antwoorden
- Staven staan niet aan elkaar vast zonder
tussenwaarden, dus kunnen niet aan elkaar zitten
- Je haalt de waarden weg die geen data hebben
- Pareto chart staafdiagram waarbij categorieën
gerangschikt zijn op basis van hun frequentie
, o Pareto principle principe waarin wordt gesteld dat een kleine subset van
categorieën vaak het merendeel van de waarnemingen bevat
Frequentie Tabel; kan ook met percentage (slide 24)
- Een lijst met mogelijke waarden voor een variabele, samen met het aantal
waarnemingen voor elke waarde.
- Missing (rij): participanten hebben geen data
- Valid (geldig): alle data die wel is gemeten (dus missing erbuiten gelaten)/hebben
meegedaan
- Cummulatief: ?? welk percentage heeft deze score of lager geen rekening
gehouden met missing alleen valid
Dot plot
- Een dot plot toont een punt voor elke
waarneming, net boven de waarde op de
getallenlijn voor die waarneming.
- Kwantitatieve variabelen
- Teken een horizontale lijn voor elke
observatie zet je een stip boven de waarde je
stapelt de stippen op
Stem-and-Leaf plot
- Lijkt op een dot plot
- Elke observatie wordt gerepresenteerd door een
‘stem’ (stam) en een ‘leaf’ (blad)
o Stem alle cijfers behalve het laatste DUS van 31 schrijf je
bij de stam 3 en bij het blaadje 1
- Sorteer de gegevens van klein naar groot
Histogram
- Gebruik van frequenties of relatieve frequenties van de
mogelijke uitkomsten om een kwantitatieve variabele
weer te geven
- Er zijn wel tussenwaarden, daarom zitten de staven wel
aan elkaar
- Let op! Passende interval kiezen te breed/te weinig,
dan is hij niet representatief genoeg, en kan je de grafiek minder goed aflezen; te
, College 1
Leerdoelen
- Begrip van fundamentele bergippen
o Steekproef en populatie
o Variabele
o ‘Statistic’ (grootheid/statistiek) en parameter
o Beschrijvende en toetsbare statistiek
- Een passende centrummaat bij het type variabele kiezen en berekenen
- Data grafische weergeven op een manier die past bij het type variabelen
Steekproef zit in populatie
- Populatie te groot om volledig te onderzoeken, en niet allemaal
te bereiken
- Populatie: de totale verzameling van onderwerpen waarin we
geïnteresseerd zijn.
- Steekproef: een deelverzameling van de populatie waarvoor
we gegevens hebben (of van plan zijn te verzamelen), vaak
willekeurig geselecteerd.
- Met steekproef iets zeggen over de populatie
- Hoe goed kunnen nederlandse peuters tellen voordat zij naar de basisschool gaan?
o Steekproef: 52 drieëneenhalfjarige kinderen in NL
o Wat je onderzoekt taalvaardigheden
Variabelen
- Categorische variabele
o Nominaal bijv. Haar kleur, lievelingsfilm,
losstaande categorieen
o Ordinaal losstaande categorieën, maar wel
een orde aan te geven (zoals leeftijd, peuters,
tieners, ouderen); nummers hebben geen
betekenis (je kan nummer toekennen, maar
niet tellen)
- Kwantitatieve variabelen (nummers wel betekenis)
o Interval afstanden tussen getallen ‘kloppen’, gelijk, je kan er mee rekenen
en vergelijken.
Bijvoorbeeld graden Celsius
o Ratio absoluut nulpunt. Afwezigheid (bij 0 paar schoenen, zijn ze er
gewoon niet)
Bijvoorbeeld graden Kelvin absoluut nulpunt. Je kan niet minder
dan 0 hebben
o Discrete variabele hebben een vaste waarde en geen tussenwaarden, niet
teveel decimalen. Wordt gebruikt in sociale wetenschappen.
, o Continu variabele op een conitnuum, je zou oneindig door kunnen gaan,
bijvoorbeeld tijd op de nanoseconde specificeren en nooit afronden
Statistic (grootheid) en parameter
- Statistic steekproefwaarde
o Kan je altijd berekenen bij steekproef
o Specifieke data van een steekproef
- Parameter populatiewaarde
o Vaak schatten, want je niet alle waarden hebt van een populatie
o Numerieke samenvatting van de populatie
- Beschrijvende statistiek: data samenvatten en beschrijven van de steekproef
- Toetsende statistiek: wat in steekproef is gemeten of dat ook opgaat in de populatie
Redenen om statischtische methodes te gebruiken
- Design: het doel en/of de statistische vraag van belang/interesse formuleren en
plannen hoe gegevens kunnen worden verkregen om deze te beantwoorden.
- Beschrijven (description): samenvatten an analyseren van data dat is verkregen
- Conclusie (inference): beslissingen nemen en voorspellingen doen op basis van de
gegevens om de statistische vraag te beantwoorden
Beschrijvende statistiek voor één variabele
- Grafische weergave
- Centrummaten: waar zitten de meeste mensen
- Spreidingsmaten ( college 2): hoe verschillen de mensen van elkaar
- Vb. Hoe goed kunnen nederlandse peuters tellen voordat zij naar de basisschool
gaan?
o Variabelen: tellen van vijf blokes. Kan je het wel of kan je het niet?
o Correct or incorrect
Grafische weergave
Cirkeldiagram (pie chart) beschrijvende statstieken
categorische variabele
- Snel overzichtelijk
- De grootte van een deel komt overeen met het
percentage waarnemingen in de categorie
Staafdiagram (barplot/ bar graph) hoogte blokjes met
nummers (bij voorbeeld peuters)
- Inzicht in waar meer participanten op antwoorden
- Staven staan niet aan elkaar vast zonder
tussenwaarden, dus kunnen niet aan elkaar zitten
- Je haalt de waarden weg die geen data hebben
- Pareto chart staafdiagram waarbij categorieën
gerangschikt zijn op basis van hun frequentie
, o Pareto principle principe waarin wordt gesteld dat een kleine subset van
categorieën vaak het merendeel van de waarnemingen bevat
Frequentie Tabel; kan ook met percentage (slide 24)
- Een lijst met mogelijke waarden voor een variabele, samen met het aantal
waarnemingen voor elke waarde.
- Missing (rij): participanten hebben geen data
- Valid (geldig): alle data die wel is gemeten (dus missing erbuiten gelaten)/hebben
meegedaan
- Cummulatief: ?? welk percentage heeft deze score of lager geen rekening
gehouden met missing alleen valid
Dot plot
- Een dot plot toont een punt voor elke
waarneming, net boven de waarde op de
getallenlijn voor die waarneming.
- Kwantitatieve variabelen
- Teken een horizontale lijn voor elke
observatie zet je een stip boven de waarde je
stapelt de stippen op
Stem-and-Leaf plot
- Lijkt op een dot plot
- Elke observatie wordt gerepresenteerd door een
‘stem’ (stam) en een ‘leaf’ (blad)
o Stem alle cijfers behalve het laatste DUS van 31 schrijf je
bij de stam 3 en bij het blaadje 1
- Sorteer de gegevens van klein naar groot
Histogram
- Gebruik van frequenties of relatieve frequenties van de
mogelijke uitkomsten om een kwantitatieve variabele
weer te geven
- Er zijn wel tussenwaarden, daarom zitten de staven wel
aan elkaar
- Let op! Passende interval kiezen te breed/te weinig,
dan is hij niet representatief genoeg, en kan je de grafiek minder goed aflezen; te