Samenvatting week 2 Experimenteel en Correlationeel onderzoek
Deze week hebben we het over enkelvoudige lineaire regressie.
Een regressie maakt het mogelijk om de ene variabele uit één of meerdere
andere variabelen te voorspellen a.d.h.v. een predictor (X) en een respons (Y).
Een predictor variabele is een onafhankelijke voorspeller voor de afhankelijke
respons variabele.
Voorbeeld:
Cijfer voor IMT & cijfer voor TS
Predictor => Cijfer voor IMT (eerste meting die basis legt, goede voorspeller voor
later)
Respons => Cijfer voor TS (volgt daarna en kan beïnvloed zijn door de resultaten
van eerder)
Op het moment dat er één predictor variabele aanwezig is, spreken we over
enkelvoudige lineaire regressie.
Zijn er twee of meer predictor variabelen, dan spreken we over meervoudige
lineaire regressie. Dit laatste komt later in de cursus aan bod.
Ongestandaariseerde regressievergelijking
Om een ongestandaardiseerde regressievergelijking op te stellen, maken we
gebruik van de volgende formule ^y = b0 + b1 x
NB. ^y staat hier voor een voorspelde waarde/een schatting.
Hierbij is b0 de voorspelde waarde van y als x=0, ook wel het intercept. Te
berekenen door b0 = y – b1 ∙ x
En b1 is de hoeveelheid verschil in ^y als x met een punt stijgt, ook wel de slope.
Te berekenen door b1 = r ∙(SY : SX)
Error/Residu (ei ) = geobserveerde waarde (yi ) − voorspelde waarde ( ^y i )
Wanneer deze minimaal is, zal de regressielijn het best passend zijn.
Regressielijn tekenen
Nadat je de regressievergelijking hebt opgesteld, kun je de lijn in de scatterplot
intekenen. Dit doe je door één voor één de x-waardes in de formule in te vullen
Deze week hebben we het over enkelvoudige lineaire regressie.
Een regressie maakt het mogelijk om de ene variabele uit één of meerdere
andere variabelen te voorspellen a.d.h.v. een predictor (X) en een respons (Y).
Een predictor variabele is een onafhankelijke voorspeller voor de afhankelijke
respons variabele.
Voorbeeld:
Cijfer voor IMT & cijfer voor TS
Predictor => Cijfer voor IMT (eerste meting die basis legt, goede voorspeller voor
later)
Respons => Cijfer voor TS (volgt daarna en kan beïnvloed zijn door de resultaten
van eerder)
Op het moment dat er één predictor variabele aanwezig is, spreken we over
enkelvoudige lineaire regressie.
Zijn er twee of meer predictor variabelen, dan spreken we over meervoudige
lineaire regressie. Dit laatste komt later in de cursus aan bod.
Ongestandaariseerde regressievergelijking
Om een ongestandaardiseerde regressievergelijking op te stellen, maken we
gebruik van de volgende formule ^y = b0 + b1 x
NB. ^y staat hier voor een voorspelde waarde/een schatting.
Hierbij is b0 de voorspelde waarde van y als x=0, ook wel het intercept. Te
berekenen door b0 = y – b1 ∙ x
En b1 is de hoeveelheid verschil in ^y als x met een punt stijgt, ook wel de slope.
Te berekenen door b1 = r ∙(SY : SX)
Error/Residu (ei ) = geobserveerde waarde (yi ) − voorspelde waarde ( ^y i )
Wanneer deze minimaal is, zal de regressielijn het best passend zijn.
Regressielijn tekenen
Nadat je de regressievergelijking hebt opgesteld, kun je de lijn in de scatterplot
intekenen. Dit doe je door één voor één de x-waardes in de formule in te vullen