HOOFDSTUK 10: INFERENTIE VOOR REGRESSIE
INLEIDING
̅
𝒙 Steekproefgemiddelde
µ Populatiegemiddelde
̂ = a + bx
𝒚 Kleinste-kwadraten regressielijn
= beschrijving van een lineaire relatie tussen een te verklaren variabele y en een verklarende
variabele x
Β0 + β1x Populatielijn
B0 + b1x De aan de steekproefdata aangepaste kleinte-kwadratenlijn
Β0 Constante van de populatielijn, wordt geschat door b0
Β1 Helling, wordt geschat voor b1
12.1 ENKELVOUDIGE LINEAIRE REGRESSIE
12.1.1 STATISTISCH MODEL VOOR LINEAIRE REGRESSIE
Enkelvoudige lineaire regressie bestudeert de relatie tussen een te verklaren variabele y en één enkele
verklarende variabele x
o Verschillende x-waarden verschillende y-waarden
o X veel verschillende waarden
Subpopulaties = alle individuen van de populatie voor wie eenzelfde waarde voor x geldt.
Veronderstelling: de waargenomen waarden van de te verklaren variabele y voor elke waarde van x
zijn normaal verdeeld met een verwachting van y die van x afhangt.
o µy om de verwachtingen van y aan te duiden
Verwachting op een rechte lijn
Vergelijking: µy = β0 + β1x
o Regressielijn van de populatie: beschrijft hoe de verwachte reactie verandert met x
Β0 = constante
Β1 = helling
o Het model neemt aan dat deze variatie, gemeten door de standaardafwijking σ , voor alle
waarden van x dezelfde is.
12.1.2 GEGEVENS VOOR ENKELVOUDIGE LINEAIRE REGRESSIE
Data lineaire regressie = waargenomen waarden van x en y
o x = een vaste, bekende grootheid
o y = de waarde die verklaard wordt bij een gegeven x
= stochastische variabele verschillende waarden aannemen als we verschillende
waarnemingen hebben bij eenzelfde x-waarde
Oefening oplossen
o STAP 1: kijken naar generaliseerbaarheid resultaten
o STAP 2: analyse resultaten
Grafische weergave van de gegevens
Subpopulaties bepalen door de verklarende variabele
FIT + RESIDU = GEGEVENS
FIT = subpopulatiegemiddelden
o = β0 + β1x
1
INLEIDING
̅
𝒙 Steekproefgemiddelde
µ Populatiegemiddelde
̂ = a + bx
𝒚 Kleinste-kwadraten regressielijn
= beschrijving van een lineaire relatie tussen een te verklaren variabele y en een verklarende
variabele x
Β0 + β1x Populatielijn
B0 + b1x De aan de steekproefdata aangepaste kleinte-kwadratenlijn
Β0 Constante van de populatielijn, wordt geschat door b0
Β1 Helling, wordt geschat voor b1
12.1 ENKELVOUDIGE LINEAIRE REGRESSIE
12.1.1 STATISTISCH MODEL VOOR LINEAIRE REGRESSIE
Enkelvoudige lineaire regressie bestudeert de relatie tussen een te verklaren variabele y en één enkele
verklarende variabele x
o Verschillende x-waarden verschillende y-waarden
o X veel verschillende waarden
Subpopulaties = alle individuen van de populatie voor wie eenzelfde waarde voor x geldt.
Veronderstelling: de waargenomen waarden van de te verklaren variabele y voor elke waarde van x
zijn normaal verdeeld met een verwachting van y die van x afhangt.
o µy om de verwachtingen van y aan te duiden
Verwachting op een rechte lijn
Vergelijking: µy = β0 + β1x
o Regressielijn van de populatie: beschrijft hoe de verwachte reactie verandert met x
Β0 = constante
Β1 = helling
o Het model neemt aan dat deze variatie, gemeten door de standaardafwijking σ , voor alle
waarden van x dezelfde is.
12.1.2 GEGEVENS VOOR ENKELVOUDIGE LINEAIRE REGRESSIE
Data lineaire regressie = waargenomen waarden van x en y
o x = een vaste, bekende grootheid
o y = de waarde die verklaard wordt bij een gegeven x
= stochastische variabele verschillende waarden aannemen als we verschillende
waarnemingen hebben bij eenzelfde x-waarde
Oefening oplossen
o STAP 1: kijken naar generaliseerbaarheid resultaten
o STAP 2: analyse resultaten
Grafische weergave van de gegevens
Subpopulaties bepalen door de verklarende variabele
FIT + RESIDU = GEGEVENS
FIT = subpopulatiegemiddelden
o = β0 + β1x
1