Opdracht 1 Simpele regressie/ bivariate relatie
A. Maak een scatterplot met op de X skinfold en de Y body mass.
o Je klikt op ghraps en dan de sipmle dot. Als je dan twee keer op de
grafiek klikt en kiest voor add fine line at total dan zie je de regressie
formule.
B. De relatie is lineair, sterk en negatief.
o Omdat je hoog bij intercept begint, je X is negatief want je hebt steeds -
0,06.
C. Voer een regressieanalyse uit om body mass te voorspellen van skinfold. Wat
is de formule en wat is de R squared value en wat betekent dit?
o Je kijkt naar constant dat is 1,163 – 0,063 x skinfold
o R- Squared is 0,720 dus 72% van de variantie van bodymass wordt
verklaard door skinfold.
Model Summary
Change Statistics
R Std. Error F
Mod Squar Adjusted of the R Square Chang Sig. F
el R e R Square Estimate Change e df1 df2 Change
1 .849a .720 .717 .008539 .720 231.89 1 90 <.001
4
a. Predictors: (Constant), lskin
ANOVAa
Sum of Mean
Model Squares df Square F Sig.
1 Regressi .017 1 .017 231.894 <.001b
on
Residual .007 90 .000
Total .023 91
a. Dependent Variable: den
b. Predictors: (Constant), lskin
Coefficientsa
Standardize
Unstandardized d
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Consta 1.163 .007 177.29 <.001
nt) 6
, lskin -.063 .004 -.849 -15.228 <.001
a. Dependent Variable: den
D. Formuleer de hypothesen met betrekking tot de regressiecoëfficiënt.
H0: β1 = 0 (geen effect)
Ha: β1 ≠ 0 (wel effect)
In de populatie praten we over β
In de steekproef over beta dus b
In spss staat het in de b
E. Met een t(90)= -15.23, p < 0,01. Dus uit de b waarde van Skinfold kunnen we
afleiden dat een toename van skinfold is geassocieerd met afname van body
mass met b= -0,063.
F. Doe de analyse opnieuw en sla (gebruik de optie Save) de voorspelde
waarden voor lichaamsmassa op. Zoek daarna deze nieuwe variabele op in
de data-editor.
o Naar analyze dan regressie, lineair en dan kiezen voor save en
unstandardized. Je krijgt dan de voorspelde waarden in een vierde
kolom.
G. Maak een scatterplot van skinfold thickness (LSKIN) (x-as) en de voorspelde
waarden voor lichaamsmassa (y-as). Vergelijk deze scatterplot met de
scatterplot die je bij vraag a hebt gemaakt. Leg het verschil tussen de twee
grafieken uit en gebruik daarbij de term “residual”.
Je doet weer grafiek en dat dots en simple. Maar ipv de werkelijke waarden te doen
gebruik je dus die ungestandaardizeerde waarden. Dat zijn je voorspelde waarden
die rechtstreeks uit je model komen. Dus is Y met een dakje.
De conclusie is dat je regressiemodel scores voorspelt die op een rechte lijn liggen,
terwijl de “echte gegevens” rond deze lijn liggen en er dus voorspellingsfouten
(residuen) zullen zijn.
Dit is de grafiek met voorspelde/ungestandaardizeerde waarden hierbij geen error
hierbij is Y dakje = ax + b:
,Dit is de grafiek met je werkelijke waarden hierbij wel een error want je hebt altijd
Model + error = Y:
, Syntax
GRAPH
/SCATTERPLOT(BIVAR)=lskin WITH den
/MISSING=LISTWISE.
REGRESSION
/DESCRIPTIVES MEAN STDDEV CORR SIG N
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA CHANGE
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT den
/METHOD=ENTER lskin.
REGRESSION
/DESCRIPTIVES MEAN STDDEV CORR SIG N
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA CHANGE
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT den
/METHOD=ENTER lskin
/SAVE PRED.
GRAPH
/SCATTERPLOT(BIVAR)=lskin WITH PRE_1
/MISSING=LISTWISE.
Opdracht 2 Checken op lineariteit
Het doel van deze oefening is te laten zien hoe belangrijk het is om een scatterplot van je
variabelen te bekijken. Dit helpt je bepalen of een regressievergelijking geschikt is om de
gegevens te beschrijven. Een hoge R2R^2 betekent niet altijd dat de relatie tussen de
uitkomst en voorspeller lineair is.
A. Je berekent voor elk paar (X1–Y1, X2–Y2, X3–Y3 en X4–Y4): de correlatie
en de regressiecoëfficiënt (b). Wat valt je op?
Je doet hier weer analyze → regressie → lineair. Je kiest elke keer Y1 met X1. En
dan Y2 voor X2 en zo ga je door. Je doet de Y bij de afhankelijke en de X bij
onafhankelijke variabel.
Wat opvalt is dat de squared R bij elke regressie hetzelfde is namelijk 0,66. De
constante en de helling is ook bij alle vier de regressies hetzelfde. Namelijk
constante = 3,001 en de helling 0,500. De correlatie is bij allemaal 0,82.