Statistiek 3
Lecture 1: herhaling
Beschrijvende en inferentiële statistiek
- Beschrijvende statistiek – samenvatten van de data middels tabellen en figuren
- Inferentiele statistiek – het maken van voorspellingen over de populatie parameters
- Data – observation of characteristics
o Populatie – totale set van de participanten
Populatie parameter – gemiddelde aantal uur van zelfstudie
o Sample – een klein stukje van de populatie van wie er data is verzameld
Sample statistic – gemiddelde van de sample
- Betrouwbaarheid – hoe precies is de meting
- Validiteit – is er bias? Er mag een bias zijn!
Beschrijvende statistiek
- Variabele – meet kenmerken die verschillen tussen onderwerpen
- Types – behaviour-, stimulus-, subject-, physiological variables
- Meetschalen (NOIR)
o Categorisch/kwalitatief
Nominaal – ongeordende categorieën (oogkleur, biologisch geslacht)
Ordinaal – geordende categorieën (niet mee eens/neutraal/mee eens)
o Kwantitatief/numeriek
Interval – gelijke afstand tussen opeenvolgende waarden (graden)
Ratio - gelijke afstand en echt nul punt (Kelvin)
- Range
o Discreet – meeteenheid die ondeelbaar is (# broers/zussen)
o Continu – oneindig deelbare meeteenheid (lichaamslengte)
, - 3 dimensies in beschrijvende statistiek
o Centrale tendens – typische observatie
Centrale tendens metingen – gemiddelde, modus, mediaan
o Dispersie – variabiliteit in waarnemingen
Dispersie metingen – standaarddeviatie, variantie, interkwartielbereik
(75%-25% = het midden 50%)
o Positie – relatieve positieve van de waarneming
Geeft informatie over relatieve posities van waarnemingen: percentiel,
kwartiel
Example
- Op welke manieren kun je de verschillen tussen deze twee verdelingen beschrijven
Inferential statistics
- Doel – betrouwbare en valide statements maken over de populatie gebaseerd op een
sample
o De sample mag niet verschillen van de populatie!
- Problemen
o Sampling error – natuurlijke willekeurige steekproefvariantie
o Sampling bias – selectieve sampling
o Response bias – onjuist antwoord
o Non-response bias – selective deelname van participanten
- Belangrijk verschil tussen problemen tussen betrouwbaarheid (error) en validiteit
(bias)
, - Oplossing – een aselecte steekproef of een andere voldoende grote kans steekproef
die gegevens oplevert voor alle benaderde personen, met correcte antwoorden op
alle items voor alle proefpersonen
Dimensies van verdelingen
- Populatieverdeling
o Percentage leerlingen dat aangeeft extra ondersteuning bij wiskunde nodig te
hebben
- Steekproefverdeling
o Percentage leerlingen in de steekproef (hier n = 1000) dat aangeeft extra
ondersteuning bij wiskunde nodig te hebben
- Steekproevenverdeling
o De kansverdeling voor de steekproefstatistiek
(proportie/gemiddelde/regressiecoëfficiënt). Te interpreteren als resultaat
van het herhaald nemen van een steekproef van grootte n (hier n = 1000)
o Steekproefgrootte neemt toe, standaardafwijking neemt af, lagere mate van
onzekerheid
o 50 min: ff luisteren
, Centrale limiet stelling voor steekproefverdeling
- Empirische regel voor een normaalverdeling
o 68% within +- 1σ of the mean
o 95% within +-2 σ of the man
o Almost 100% within +- 3σ of the mean
Relaties tussen populatieverdeling, steekproefverdeling en
steekproevenverdeling
- Distribution of means normal distribution
Types of probability distribution
- Standard!! normaalverdeling z-toets
o Normaalverdeling voor proportie wanneer H0 geldt
o Sampling distribution for proportion when H0 holds
o (steekproefverdeling voor gemiddelde wanneer H0 geldt en de
standaardafwijking van de populatie bekend is)
o Elke Z-waarde waarschijnlijkheid
- Student’s T verdeling (en) t-toets
o Steekproefverdeling voor gemiddelde wanneer H0 geldt en de
standaardafwijking van de populatie onbekend is
o Steekproefverdeling voor regressiecoëfficiënt(en) wanneer H0 geldt
- Chi square verdeling χ2-toets (chi-kwadraat)
o Steekproefverdelingen voor gekwadrateerde afwijkingen (in frequenties) van
categorische variabelen wanneer H0 geldt
- Fisher’s distributions F-toets
o Steekproefverdeling voor ANOVA-omnibus test van gemiddelden wanneer
H0 geldt
Lecture 1: herhaling
Beschrijvende en inferentiële statistiek
- Beschrijvende statistiek – samenvatten van de data middels tabellen en figuren
- Inferentiele statistiek – het maken van voorspellingen over de populatie parameters
- Data – observation of characteristics
o Populatie – totale set van de participanten
Populatie parameter – gemiddelde aantal uur van zelfstudie
o Sample – een klein stukje van de populatie van wie er data is verzameld
Sample statistic – gemiddelde van de sample
- Betrouwbaarheid – hoe precies is de meting
- Validiteit – is er bias? Er mag een bias zijn!
Beschrijvende statistiek
- Variabele – meet kenmerken die verschillen tussen onderwerpen
- Types – behaviour-, stimulus-, subject-, physiological variables
- Meetschalen (NOIR)
o Categorisch/kwalitatief
Nominaal – ongeordende categorieën (oogkleur, biologisch geslacht)
Ordinaal – geordende categorieën (niet mee eens/neutraal/mee eens)
o Kwantitatief/numeriek
Interval – gelijke afstand tussen opeenvolgende waarden (graden)
Ratio - gelijke afstand en echt nul punt (Kelvin)
- Range
o Discreet – meeteenheid die ondeelbaar is (# broers/zussen)
o Continu – oneindig deelbare meeteenheid (lichaamslengte)
, - 3 dimensies in beschrijvende statistiek
o Centrale tendens – typische observatie
Centrale tendens metingen – gemiddelde, modus, mediaan
o Dispersie – variabiliteit in waarnemingen
Dispersie metingen – standaarddeviatie, variantie, interkwartielbereik
(75%-25% = het midden 50%)
o Positie – relatieve positieve van de waarneming
Geeft informatie over relatieve posities van waarnemingen: percentiel,
kwartiel
Example
- Op welke manieren kun je de verschillen tussen deze twee verdelingen beschrijven
Inferential statistics
- Doel – betrouwbare en valide statements maken over de populatie gebaseerd op een
sample
o De sample mag niet verschillen van de populatie!
- Problemen
o Sampling error – natuurlijke willekeurige steekproefvariantie
o Sampling bias – selectieve sampling
o Response bias – onjuist antwoord
o Non-response bias – selective deelname van participanten
- Belangrijk verschil tussen problemen tussen betrouwbaarheid (error) en validiteit
(bias)
, - Oplossing – een aselecte steekproef of een andere voldoende grote kans steekproef
die gegevens oplevert voor alle benaderde personen, met correcte antwoorden op
alle items voor alle proefpersonen
Dimensies van verdelingen
- Populatieverdeling
o Percentage leerlingen dat aangeeft extra ondersteuning bij wiskunde nodig te
hebben
- Steekproefverdeling
o Percentage leerlingen in de steekproef (hier n = 1000) dat aangeeft extra
ondersteuning bij wiskunde nodig te hebben
- Steekproevenverdeling
o De kansverdeling voor de steekproefstatistiek
(proportie/gemiddelde/regressiecoëfficiënt). Te interpreteren als resultaat
van het herhaald nemen van een steekproef van grootte n (hier n = 1000)
o Steekproefgrootte neemt toe, standaardafwijking neemt af, lagere mate van
onzekerheid
o 50 min: ff luisteren
, Centrale limiet stelling voor steekproefverdeling
- Empirische regel voor een normaalverdeling
o 68% within +- 1σ of the mean
o 95% within +-2 σ of the man
o Almost 100% within +- 3σ of the mean
Relaties tussen populatieverdeling, steekproefverdeling en
steekproevenverdeling
- Distribution of means normal distribution
Types of probability distribution
- Standard!! normaalverdeling z-toets
o Normaalverdeling voor proportie wanneer H0 geldt
o Sampling distribution for proportion when H0 holds
o (steekproefverdeling voor gemiddelde wanneer H0 geldt en de
standaardafwijking van de populatie bekend is)
o Elke Z-waarde waarschijnlijkheid
- Student’s T verdeling (en) t-toets
o Steekproefverdeling voor gemiddelde wanneer H0 geldt en de
standaardafwijking van de populatie onbekend is
o Steekproefverdeling voor regressiecoëfficiënt(en) wanneer H0 geldt
- Chi square verdeling χ2-toets (chi-kwadraat)
o Steekproefverdelingen voor gekwadrateerde afwijkingen (in frequenties) van
categorische variabelen wanneer H0 geldt
- Fisher’s distributions F-toets
o Steekproefverdeling voor ANOVA-omnibus test van gemiddelden wanneer
H0 geldt