Samenvatting Toetsende Statistiek
Week 1: Steekproevenverdeling en hypothese toetsen
Populatiegemiddelde = μ
Steekproefgemiddelde = x̅
Steekproefverdeling = verdeling van antwoorden uit je steekproef
Steekproevenverdeling = verdeling van gemiddelden van alle steekproeven. Hoe meer steekproeven,
hoe betrouwbaarder.
Populatieverdeling = verdeling van antwoorden van de hele populatie.
Nulhypothese (H0) = stelt dat er geen effect of verschil is.
Alternatieve hypothese = (Ha) = stelt dat er wel een effect is.
Eenzijdig – alternatieve hypothese stelt ook naar welke kant dat effect is (< of >).
Tweezijdig – alternatieve hypothese stelt dat er een effect is, maar niet naar welke kant (≠).
P-waarde = waarschijnlijkheid om een resultaat als X te vinden. Hoe kleiner, hoe minder
waarschijnlijk.
Fisher – P-waarde laat de sterkte van het bewijs tegen de nulhypothese zien.
Neyman-Pearson- P-waarde bepaald of nulhypothese of alternatieve hypothese wordt
aangenomen.
Criterium α = kritieke waarde vanaf waar de nulhypothese wordt verworpen.
Conclusie = het is statistisch significant, maar is het ook praktisch significant of relevant?
Om te weten of je effect niet aan je steekproef ligt, heb je een grotere steekproef nodig of een
steekproevenverdeling.
Fouten = Type1-fout (α onterecht nulhypothese verwerpen) Type2-fout (β, onterecht nulhypothese
aannemen)
Stappen in hypothese toetsing
1. Hypothesis. → bedenken van H0 en Ha
2. Steekproevenverdeling → Verdeling van de test statistiek onder H0
3. Test statistiek → steekproef statistiek → test statistiek
4. Verwerping → gebruik een lijn of regio
5. Statistische conclusie → H0 aannemen of verwerpen
6. Substantieve conclusie → beantwoord de onderzoeksvraag.
1
, Week 2: Basisprincipes van waarschijnlijkheid
Random variabele = variabele met (numerieke) waarden verkregen door trekken van een steekproef
door een ander willekeurig proces.
Wet van grote getallen = hoe groter een steekproef, hoe dichter het steekproefgemiddelde bij het
populatie gemiddelde.
Disjuncte gebeurtenissen = gebeurtenissen die nooit tegelijkertijd kunnen gebeuren. Kans op A of B.
Marginale kans = kans bij beschouwen van één enkele variabele (los van andere variabelen)
Gezamenlijke kans = kans op combinatie van gebeurtenissen. Kans op A en B.
Conditionele kans = kans op een gebeurtenis gegeven een andere gebeurtenis heeft plaatsgevonden.
Complementregel = P(x) = 1 – P(x̅)
Algemene somregel = P(A|B) = P(A) + P(B) – P(A en B)
Somregel voor disjuncte gebeurtenissen = P(A of B) = P(A) + P(B)
Algemene productregel = P(A en B) = P(A) x P(B|A)
Productregel voor afhankelijke gebeurtenissen – P(A en B) = P(A) x P(B)
Week 3: Categorisch onderzoek en chi-kwadraat
Onafhankelijke variabelen = wanneer conditionele kans gelijk zijn voor alle condities of de
conditionele kans gelijk is aan de marginale kans.
Verwachte waarde = de waarde die verwacht kan worden aan de hand van de totale frequenties.
𝑓(𝐴)×𝑓(𝐵)
𝑓𝑒 (𝐴𝑒𝑛 𝐵) = 𝑁
(𝑓𝑜 −𝑓𝑒 )2
Chi-kwadraat voor onafhankelijkheid = 𝜒 2 = ∑ Non-directional/tweezijdig. Maar ook
𝑓𝑒
éénzijdig. Een onafhankelijke toets voor de relatie tussen variabelen, wanneer aangenomen dat zij
onafhankelijk van elkaar zijn. Vrijheidsgraden → ⅆ𝑓 = (𝑟 − 1) × (𝐶 − 1). 1 populatie, 2 variabelen.
(𝑓𝑜 −𝑓𝑒 )2
Chi-kwadraat voor homogeniteit = 𝜒 2 = ∑ 𝑓𝑒
voor onderzoeken of twee of meer populaties
gelijk verdeeld zijn op één variabele. Meerdere populaties, 1 variabele. ⅆ𝑓 = (𝑟 − 1) × (𝐶 − 1).
(𝑓𝑜 −𝑓𝑒 )2
Chi-kwadraat voor goodness-of-fit = 𝜒 2 = ∑ 𝑓𝑒
1 populatie, 1 variabele, meerdere categorieën.
df = #categorieën – 1.
2
Week 1: Steekproevenverdeling en hypothese toetsen
Populatiegemiddelde = μ
Steekproefgemiddelde = x̅
Steekproefverdeling = verdeling van antwoorden uit je steekproef
Steekproevenverdeling = verdeling van gemiddelden van alle steekproeven. Hoe meer steekproeven,
hoe betrouwbaarder.
Populatieverdeling = verdeling van antwoorden van de hele populatie.
Nulhypothese (H0) = stelt dat er geen effect of verschil is.
Alternatieve hypothese = (Ha) = stelt dat er wel een effect is.
Eenzijdig – alternatieve hypothese stelt ook naar welke kant dat effect is (< of >).
Tweezijdig – alternatieve hypothese stelt dat er een effect is, maar niet naar welke kant (≠).
P-waarde = waarschijnlijkheid om een resultaat als X te vinden. Hoe kleiner, hoe minder
waarschijnlijk.
Fisher – P-waarde laat de sterkte van het bewijs tegen de nulhypothese zien.
Neyman-Pearson- P-waarde bepaald of nulhypothese of alternatieve hypothese wordt
aangenomen.
Criterium α = kritieke waarde vanaf waar de nulhypothese wordt verworpen.
Conclusie = het is statistisch significant, maar is het ook praktisch significant of relevant?
Om te weten of je effect niet aan je steekproef ligt, heb je een grotere steekproef nodig of een
steekproevenverdeling.
Fouten = Type1-fout (α onterecht nulhypothese verwerpen) Type2-fout (β, onterecht nulhypothese
aannemen)
Stappen in hypothese toetsing
1. Hypothesis. → bedenken van H0 en Ha
2. Steekproevenverdeling → Verdeling van de test statistiek onder H0
3. Test statistiek → steekproef statistiek → test statistiek
4. Verwerping → gebruik een lijn of regio
5. Statistische conclusie → H0 aannemen of verwerpen
6. Substantieve conclusie → beantwoord de onderzoeksvraag.
1
, Week 2: Basisprincipes van waarschijnlijkheid
Random variabele = variabele met (numerieke) waarden verkregen door trekken van een steekproef
door een ander willekeurig proces.
Wet van grote getallen = hoe groter een steekproef, hoe dichter het steekproefgemiddelde bij het
populatie gemiddelde.
Disjuncte gebeurtenissen = gebeurtenissen die nooit tegelijkertijd kunnen gebeuren. Kans op A of B.
Marginale kans = kans bij beschouwen van één enkele variabele (los van andere variabelen)
Gezamenlijke kans = kans op combinatie van gebeurtenissen. Kans op A en B.
Conditionele kans = kans op een gebeurtenis gegeven een andere gebeurtenis heeft plaatsgevonden.
Complementregel = P(x) = 1 – P(x̅)
Algemene somregel = P(A|B) = P(A) + P(B) – P(A en B)
Somregel voor disjuncte gebeurtenissen = P(A of B) = P(A) + P(B)
Algemene productregel = P(A en B) = P(A) x P(B|A)
Productregel voor afhankelijke gebeurtenissen – P(A en B) = P(A) x P(B)
Week 3: Categorisch onderzoek en chi-kwadraat
Onafhankelijke variabelen = wanneer conditionele kans gelijk zijn voor alle condities of de
conditionele kans gelijk is aan de marginale kans.
Verwachte waarde = de waarde die verwacht kan worden aan de hand van de totale frequenties.
𝑓(𝐴)×𝑓(𝐵)
𝑓𝑒 (𝐴𝑒𝑛 𝐵) = 𝑁
(𝑓𝑜 −𝑓𝑒 )2
Chi-kwadraat voor onafhankelijkheid = 𝜒 2 = ∑ Non-directional/tweezijdig. Maar ook
𝑓𝑒
éénzijdig. Een onafhankelijke toets voor de relatie tussen variabelen, wanneer aangenomen dat zij
onafhankelijk van elkaar zijn. Vrijheidsgraden → ⅆ𝑓 = (𝑟 − 1) × (𝐶 − 1). 1 populatie, 2 variabelen.
(𝑓𝑜 −𝑓𝑒 )2
Chi-kwadraat voor homogeniteit = 𝜒 2 = ∑ 𝑓𝑒
voor onderzoeken of twee of meer populaties
gelijk verdeeld zijn op één variabele. Meerdere populaties, 1 variabele. ⅆ𝑓 = (𝑟 − 1) × (𝐶 − 1).
(𝑓𝑜 −𝑓𝑒 )2
Chi-kwadraat voor goodness-of-fit = 𝜒 2 = ∑ 𝑓𝑒
1 populatie, 1 variabele, meerdere categorieën.
df = #categorieën – 1.
2