Week 1: Steekproevenverdelingen en hypothesetoetsing
Gemiddelde oorlengte normaal konijn: 7 cm
Hypothese: H0 : μ = 7 en Ha : μ > 7 – keuze voor eenzijdig (links/rechts) of tweezijdig is afhankelijk
van onze kennis en verwachting
- Een uitspraak over parameters in de populatie
- Nulhypothese (H0): zegt ‘er is niets aan de hand’ in de populatie (geen verandering, geen
verschil, geen relatie)
- Alternatieve hypothese (Ha): zegt ‘er is iets aan de hand’ in de populatie (wat we denken/hopen
dat het geval is)
Steekproevenverdeling: een verdeling van een statistiek verkregen uit alle mogelijke steekproeven
van een bepaalde grootte (n) uit een populatie
- Bij de konijnen: de verdeling van de gemiddelde oorlengte van alle mogelijke steekproeven van 5
konijnen uit de gewone populatie
Steekproefverdeling: de verdeling van waarden binnen een steekproef
- Bij de konijnen: de verdeling van de oorlengte van de konijnen in mijn steekproef
P-waarde: de kans op deze of een extremere toetsstatistiek, als in werkelijkheid de nulhypothese
waar is
- De p-waarde laat de kracht van het bewijs tegen de nulhypothese zien
- Als de p-waarde erg laag is, is de data onwaarschijnlijk onder de nulhypothese, dus dan is de
nulhypothese waarschijnlijk onjuist
- We gebruikten bij de konijnen het gemiddelde, maar meestal gebruiken we een specifieke soort
toetsstatistiek
- Bijvoorbeeld: X2-statistiek, t-statistiek
- Het voordeel hiervan is dat we hun verdeling kunnen berekenen zonder al die steekproeven te
nemen van de populatie onder de nulhypothese. Dan weten we dus hun steekproevenverdeling
Hypothesetoets: een statistische methode om uit steekproefdata een uitspraak te doen over een
nulhypothese
Significantieniveau: α
Als de kans (p-waarde) kleiner is dan α verwerpen we H0
Dus, verwerp H0 als p α
Deze α geeft ook een kritieke waarde en een verwerpingsgebied
Als de steekproefstatistiek in het verwerpingsgebied ligt, verwerpen we H 0
Dus verwerp H0 als x ≥ xα
In de praktijk
Onderzoekers zoeken een significantieniveau α (vaak 0.05)
Ze rapporteren zowel de p-waarde als de beslissing (verwerpen of niet) over de nulhypothese
Lagere p-waarden worden gezien als sterker bewijs
Type-I-fout (kans α): verwerp een nulhypothese die eigenlijk waar is
- We concluderen dat er een effect is, maar dat is er niet
Type-II-fout (kans ): een nulhypothese niet verwerpen, terwijl hij wel onjuist is
- We missen een effect dat er wel is
,Week 2: Basisconcepten van waarschijnlijkheid
Random variabele: een variabele met (numerieke) waardes verkregen door trekking of andere
random processen
- Een maken: hoeveel kinderen zou je graag willen krijgen?
Proportie die het niet wil?
Proportie die het wel wil?
Proportie die 2/meer wil?
Hoe ziet de verdeling eruit?
Wat is de verwachte waarde (gemiddelde) in onze populatie?
μX =
0+0.05+0.81+0.47+0.22+0.08+0.09
= 1.71
De verwachte waarde is hoe vaak een getal voorkomt (als een proportie) maal het getal zelf, opgeteld
voor alle getallen
Steekproefgemiddelde: Verwachte waarde van X (discreet):
Wet van de grote aantallen: hoe groter een steekproef, hoe dichter het steekproefgemiddelde neigt te
liggen bij het populatiegemiddelde
Variantie: hoe vaak een getal voorkomt (als een proportie) maal het gekwadrateerde verschil met de
verwachte waarde, opgeteld voor alle getallen
Steekproefvariantie:
,Algebra: vermenigvuldiging met b
Transformatie: Y = bX
Bijvoorbeeld, van gram naar grein: Y = 15.43236X
Nieuwe verwachte waarde: μY = bμX
Nieuwe variantie: σ2Y = b2σ2X
Algebra: optellen van a
Transformatie: Y = a + X
Bijvoorbeeld: opmeten van lengte kinderen op een stoel: Y = 50 + X
Nieuwe verwachte waarde: μY = a + μX
Nieuwe variantie: σ2Y = σ2X
Algebra: lineaire transformaties
Transformatie: Y = a + bX
Bijvoorbeeld, omrekenen van celcius naar fahrenheit: F = 32 + 1.8c
Nieuwe verwachte waarde: μY = a + bμX
Nieuwe variantie: σ2Y = b2σ2X
Verwachte waarde en variantie voor de som van twee random variabelen
Nieuwe verwachte waarde: μX +Y = μX + μY
Nieuwe variantie: σ2X+Y = σ2x + σ2y + 2ρXY σX σY
Som van random variabelen
Vermenigvuldigingswet (algemeen):
, A en B afhankelijk - P (A en B) = P(A) x P(B|A)
A en B onafhankelijk – P (A en B) = P(A) x P(B)
De kans op beide gebeurtenissen tegelijkertijd is het product van de kans op de ene gebeurtenis, en
de kans op de andere gebeurtenis gegeven de eerste gebeurtenis
Wet van complementerende kansen:
P(A) = 1 – P(AC)
Marginale kans: wat is de kans om Nederlands te zijn – P(A)
Conditionele kans: wat is de kans om Nederlands te zijn, gegeven dat de student een partner heeft –
P(A|B)
Gezamenlijke kans: wat is de kans om Nederlands te zijn EN een partner te hebben – P (A en B)
Additieve wet : P (A of B) = P(A) + P(B) – P(A en B)
Voor kansen voor disjuncte gebeurtenissen: wat is de kans om Nederlands te zijn OF een
partner te hebben – P (A of B) = P(A) + P(B)
Vermenigvuldigingswet: P(A en B) = P(A) x P(B|A)
Voor kansen van onafhankelijke gebeurtenissen – wat is de kans om Nederlands te zijn EN
een partner te hebben – P (A en B) = P(A) x P(B)
Niet-disjuncte gebeurtenis: elkaar niet uitsluitende kansen
Twee random variabelen zijn onafhankelijk als
1. De conditionele kansen gelijk zijn voor alle condities
2. De conditionele kansen gelijk zijn aan de marginale kansen
Gemiddelde oorlengte normaal konijn: 7 cm
Hypothese: H0 : μ = 7 en Ha : μ > 7 – keuze voor eenzijdig (links/rechts) of tweezijdig is afhankelijk
van onze kennis en verwachting
- Een uitspraak over parameters in de populatie
- Nulhypothese (H0): zegt ‘er is niets aan de hand’ in de populatie (geen verandering, geen
verschil, geen relatie)
- Alternatieve hypothese (Ha): zegt ‘er is iets aan de hand’ in de populatie (wat we denken/hopen
dat het geval is)
Steekproevenverdeling: een verdeling van een statistiek verkregen uit alle mogelijke steekproeven
van een bepaalde grootte (n) uit een populatie
- Bij de konijnen: de verdeling van de gemiddelde oorlengte van alle mogelijke steekproeven van 5
konijnen uit de gewone populatie
Steekproefverdeling: de verdeling van waarden binnen een steekproef
- Bij de konijnen: de verdeling van de oorlengte van de konijnen in mijn steekproef
P-waarde: de kans op deze of een extremere toetsstatistiek, als in werkelijkheid de nulhypothese
waar is
- De p-waarde laat de kracht van het bewijs tegen de nulhypothese zien
- Als de p-waarde erg laag is, is de data onwaarschijnlijk onder de nulhypothese, dus dan is de
nulhypothese waarschijnlijk onjuist
- We gebruikten bij de konijnen het gemiddelde, maar meestal gebruiken we een specifieke soort
toetsstatistiek
- Bijvoorbeeld: X2-statistiek, t-statistiek
- Het voordeel hiervan is dat we hun verdeling kunnen berekenen zonder al die steekproeven te
nemen van de populatie onder de nulhypothese. Dan weten we dus hun steekproevenverdeling
Hypothesetoets: een statistische methode om uit steekproefdata een uitspraak te doen over een
nulhypothese
Significantieniveau: α
Als de kans (p-waarde) kleiner is dan α verwerpen we H0
Dus, verwerp H0 als p α
Deze α geeft ook een kritieke waarde en een verwerpingsgebied
Als de steekproefstatistiek in het verwerpingsgebied ligt, verwerpen we H 0
Dus verwerp H0 als x ≥ xα
In de praktijk
Onderzoekers zoeken een significantieniveau α (vaak 0.05)
Ze rapporteren zowel de p-waarde als de beslissing (verwerpen of niet) over de nulhypothese
Lagere p-waarden worden gezien als sterker bewijs
Type-I-fout (kans α): verwerp een nulhypothese die eigenlijk waar is
- We concluderen dat er een effect is, maar dat is er niet
Type-II-fout (kans ): een nulhypothese niet verwerpen, terwijl hij wel onjuist is
- We missen een effect dat er wel is
,Week 2: Basisconcepten van waarschijnlijkheid
Random variabele: een variabele met (numerieke) waardes verkregen door trekking of andere
random processen
- Een maken: hoeveel kinderen zou je graag willen krijgen?
Proportie die het niet wil?
Proportie die het wel wil?
Proportie die 2/meer wil?
Hoe ziet de verdeling eruit?
Wat is de verwachte waarde (gemiddelde) in onze populatie?
μX =
0+0.05+0.81+0.47+0.22+0.08+0.09
= 1.71
De verwachte waarde is hoe vaak een getal voorkomt (als een proportie) maal het getal zelf, opgeteld
voor alle getallen
Steekproefgemiddelde: Verwachte waarde van X (discreet):
Wet van de grote aantallen: hoe groter een steekproef, hoe dichter het steekproefgemiddelde neigt te
liggen bij het populatiegemiddelde
Variantie: hoe vaak een getal voorkomt (als een proportie) maal het gekwadrateerde verschil met de
verwachte waarde, opgeteld voor alle getallen
Steekproefvariantie:
,Algebra: vermenigvuldiging met b
Transformatie: Y = bX
Bijvoorbeeld, van gram naar grein: Y = 15.43236X
Nieuwe verwachte waarde: μY = bμX
Nieuwe variantie: σ2Y = b2σ2X
Algebra: optellen van a
Transformatie: Y = a + X
Bijvoorbeeld: opmeten van lengte kinderen op een stoel: Y = 50 + X
Nieuwe verwachte waarde: μY = a + μX
Nieuwe variantie: σ2Y = σ2X
Algebra: lineaire transformaties
Transformatie: Y = a + bX
Bijvoorbeeld, omrekenen van celcius naar fahrenheit: F = 32 + 1.8c
Nieuwe verwachte waarde: μY = a + bμX
Nieuwe variantie: σ2Y = b2σ2X
Verwachte waarde en variantie voor de som van twee random variabelen
Nieuwe verwachte waarde: μX +Y = μX + μY
Nieuwe variantie: σ2X+Y = σ2x + σ2y + 2ρXY σX σY
Som van random variabelen
Vermenigvuldigingswet (algemeen):
, A en B afhankelijk - P (A en B) = P(A) x P(B|A)
A en B onafhankelijk – P (A en B) = P(A) x P(B)
De kans op beide gebeurtenissen tegelijkertijd is het product van de kans op de ene gebeurtenis, en
de kans op de andere gebeurtenis gegeven de eerste gebeurtenis
Wet van complementerende kansen:
P(A) = 1 – P(AC)
Marginale kans: wat is de kans om Nederlands te zijn – P(A)
Conditionele kans: wat is de kans om Nederlands te zijn, gegeven dat de student een partner heeft –
P(A|B)
Gezamenlijke kans: wat is de kans om Nederlands te zijn EN een partner te hebben – P (A en B)
Additieve wet : P (A of B) = P(A) + P(B) – P(A en B)
Voor kansen voor disjuncte gebeurtenissen: wat is de kans om Nederlands te zijn OF een
partner te hebben – P (A of B) = P(A) + P(B)
Vermenigvuldigingswet: P(A en B) = P(A) x P(B|A)
Voor kansen van onafhankelijke gebeurtenissen – wat is de kans om Nederlands te zijn EN
een partner te hebben – P (A en B) = P(A) x P(B)
Niet-disjuncte gebeurtenis: elkaar niet uitsluitende kansen
Twee random variabelen zijn onafhankelijk als
1. De conditionele kansen gelijk zijn voor alle condities
2. De conditionele kansen gelijk zijn aan de marginale kansen