Elise van Gool | Diergeneeskunde UU | Jaar 3, sem. 1
INHOUD
1 statistiek .........................................................................................................................2
1.1 lineaire regressie......................................................................................................2
1.2 anova ......................................................................................................................5
1.3 uitbreidingen lineaire regressie en anova ..................................................................7
1.4 logistische regressie .............................................................................................. 10
1.5 survival analyse ..................................................................................................... 12
1.6 toetsoverzicht ........................................................................................................ 14
2 economie ...................................................................................................................... 16
2.1 economie .............................................................................................................. 16
2.2 waarde .................................................................................................................. 16
2.3 kostprijs ................................................................................................................ 16
2.4 kosten en baten ..................................................................................................... 17
2.5 marginale productie ............................................................................................... 18
2.6 partial budgeting .................................................................................................... 19
2.7 kosten-baten analyse ............................................................................................. 20
2.8 beslisboom............................................................................................................ 20
3 epidemiologie................................................................................................................ 21
3.1 studie-opzet .......................................................................................................... 21
3.2 causal pie model ................................................................................................... 23
3.3 associatiematen .................................................................................................... 24
3.4 testeigenschappen ................................................................................................ 25
3.5 serieel en parallel testen ........................................................................................ 29
3.6 koppeldiagnostiek ................................................................................................. 30
3.7 populatiedynamica van infectieziekten ................................................................... 31
3.8 critical appraisal .................................................................................................... 38
Pagina 1 van 40
,1 STATISTIEK
1.1 LINEAIRE REGRESSIE
1.1.1 Wat is regressieanalyse
Bij lineaire regressie ga je ervan uit dat er een rechte lijn bestaat tussen twee continue variabelen:
- x = onafhankelijke variabele (bijv. borstomvang) (x-as)
- y = afhankelijke variabele (bijv. gewicht) (y-as)
Met x probeer je y te voorspellen/beschrijven.
We werken met een steekproef en gebruiken die om iets te
zeggen over de populatie. De beschrijving van die relatie
noemen we een model (altijd dus een benadering!).
1.1.2 Het populatiemodel (het “echte” model)
De rechte lijn in de populatie wordt beschreven door:
𝑦𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝜀𝑖
Betekenis:
- α (intercept): snijpunt met de y-as
- β (richtingscoëfficiënt): hoeveel y verandert als x 1
eenheid toeneemt
- εᵢ (residu): afwijking van een punt t.o.v. de lijn
1.1.3 Het steekproefmodel
In de steekproef kennen we α en β niet → we schatten ze:
𝑦̂𝑖 = 𝑎 + 𝑏𝑥𝑖
- a = schatting van α
- b = schatting van β
De beste lijn is de lijn waarvoor: de som van de
gekwadrateerde residuen zo klein mogelijk is.
Totale afwijking wordt opgesplitst in:
Totale afwijking = Regressie-afwijking + Residu-afwijking
Bijbehorende kwadraatsommen:
- SStotaal = Ssreg + Ssres
Vrijheidsgraden:
- SSreg → 1
- SSres → n − 2
- SStotaal → n − 1
Pagina 2 van 40
,Varianties (gemiddelde kwadraatsommen):
- MSreg = SSreg / 1
- MSres = SSres / (n − 2)
Dit komt samen in een ANOVA tabel
1.1.4 Toetsen lineaire regressie
Hypothesen lineaire regressie:
- H₀: β = 0 (geen lineair verband)
- H₁: β ≠ 0 (wel lineair verband)
F-toets lineaire regressie:
𝑀𝑆𝑟𝑒𝑔
𝐹=
𝑀𝑆𝑟𝑒𝑠
F verdeling met 1 en n – 2 vrijheidsgraden
- Grote F → regressie verklaart veel → H₀ verwerpen
- Kleine F → weinig verklaring → H₀ behouden
T-toets lineaire regressie:
Je kan dezelfde hypothese ook testen met een t-toets (t2 = F):
𝑏−0
𝑡=
standaardfout van 𝑏
Student t-verdeling met n − 2 vrijheidsgraden
Conclusie:
- Als H0 wordt behouden: β = 0, dus er is geen lineair verband, de lijn tussen x en y is
horizontaal
- Als H0 wordt verworpen: β ≠ 0, dus er is een lineair verband, de lijn tussen x en y is niet
horizontaal
Aannames:
- Beide variabelen continu
- Lineair verband tussen de variabelen
- Onafhankelijke waarnemingen
- Beide variabelen normaal verdeeld
1.1.5 Hoe goed past de lijn?
Hoe sterk is het verband? Hoe kleiner de residuen hoe beter de lijn past bij de punten. Dit wordt
weergegeven met de R2 (het kwadraat van de correlatiecoëfficiënt):
𝑆𝑆𝑟𝑒𝑔
𝑅2 =
𝑆𝑆𝑡𝑜𝑡𝑎𝑎𝑙
Interpretatie:
Pagina 3 van 40
, - R² = deel van de totale variatie in y verklaard door x
- Waarden tussen 0 en 1
o dicht bij 0 → slechte passing
o dicht bij 1 → goede passing
R² waarde Betekenis
Dicht bij 0 Model verklaart heel weinig van de variatie → slecht voorspellend
Dicht bij 1 Model verklaart veel van de variatie → goed voorspellend
Pagina 4 van 40