Statistische modellen 2
Hoorcollege 1 Regressie-analyse
06/02/2018
Welk model? (Belangrijk voor TT!)
Welk model je kiest, is afankelijk van het
meetniveau dat je hebt.
Interval: verschillen tussen metngen
hebben op elke plek op de schaal dezelfde
betekenis (voorbeeld verschil tussen 5 en
10 jaar en verschil tussen 20 en 25 jaar).
DUM = heef maar 2 categorie-n.
1. Lineaire relatee
Relatie tussee ietevaalaaviaeelee
In veel onderzoekssituates zijn er intervalvariabelen (INT). Nulpunt, geen negateve waarden. Voorbeelden:
- Lengte, gewicht, leefijd.
- Schaalscores voor introversie, depressie, coping, attude
- Vaardigheidsscores voor taal, rekenen
Vanuit een wetenschappelijke theorie hebben we vaak verwachtngen over hoe variabelen gerelateerd zijn.
Hoe kan je een relate uitdrukken?
Vooveeeld
Onderzoek naar depressie en coping
N = 84 jongvolwassenen
Twee variabelen
- BDI (Beck Depression Inventory)
0 − 9 weinig, 10 − 18 mild, 19 − 29 matg, 30 − 63 zware depressie
- Coping score
0 = geen coping, 10 = goed kunnen omgaan met tegenslag
Onderzoeksvraag: Is er een relate tussen BDI en coping (in de populate)?
Niet precies bekend wat de populate is. Voor theorievorming is het niet interessant om alleen uitspraken te
doen over de steekproef, daarom moet je een populate bepalen (voorbeeld; jongvolwassenen in Nederland, of
jongvolwassenen in Groningen).
Spreidingsdiagram (zie plaatje): Wat valt op (visueel)?
Hogere scores op coping, dan lagere score op BDI
richtng (omgekeerd evenredig verband). Hoe sterk is de
relate? Veronderstel relate is lineair (als de een afneemt
is er een proportonele toename of afname van de
andere variabele) toename in coping is proportoneel
t.o.v. afname BDI. Een lineair model werkt goed in de
praktjk.
Lieeaive velatie
Een lineair model werkt goed in de praktjk: het blijkt dat
veel relates tussen twee intervalvariabelen met een
lineair verband zijn samen te vaten
Een lijn wordt beschreven door een helling. Dit getal (=
parameter) geef:
1
, - richtng van relate weer
- interpretate aan relate
Verschillende lijnen zijn mogelijk. Welke? eentje die ook een maat voor sterkte relate geef. Dit is de lijn die
ontstaat als de som van de kwadraten van alle residuen zo minimaal mogelijk is.
Kleieste kwadvateesom vesiduee
Welke lijn?
- Bereken alle residuen = afstand van ieder punt tot de lijn in de
vertcale richtng.
- Kwadrateer alle residuen
- Tel alle gekwadrateerde residuen op
- Lijn kiezen zodat deze som zo klein mogelijk is (de lijn zo kiezen
dat de som van alle gekwadrateerde residuen zo klein mogelijk
is)
De kleinste kwadratensom van residuen is uniek unieke lijn die die
eigenschap heef (voor elk stukje data waar je dit op los laat).
Vooveeeld
Met kleinste kwadratenlijn kunnen we nu een aantal vragen beantwoorden:
- Onderzoeksvraag 1: Is er een lineaire relate tussen BDI en coping in de populate?
- Onderzoeksvraag 2: Hoe sterk is de lineaire relate tussen BDI en coping?
1 en 2 Pearson correlate (geef aan of er waarschijnlijk een relate is in de populate)
- Onderzoeksvraag 3: Kan BDI voorspeld worden door coping?
Enkelvoudige regressieanalyse (= regressieanalyse met één voorspeller)
Peavsoe covvelatie
Onderzoeksvraag 1: Is er een relate tussen BDI en coping in de populate?
Pearson correlate:
- Maat voor sterkte lineaire relate
- Nulhypothese bij t-toets: H0: v = 0 (geen relate)
- p < 0.001 signifcante relate tussen BDI en coping
- Relate negatef: hoe meer coping, hoe minder depressie
Onderzoeksvraag 2: Hoe sterk is de relate tussen BDI en coping?
Pearson correlate:
- maat voor sterkte van een lineaire relate
- kwadraat van de correlate is de gemeenschappelijke variante tussen variabelen
- (–0.88)2 = 0.774 BDI en coping hebben dus 77% variante gemeenschappelijk
Eekelaoudige vegvessieaealyse
Onderzoeksvraag 3: Kan BDI voorspeld worden door coping?
Afankelijke variabele (Y)
- BDI (Beck Depression Inventory)
0 − 9 weinig, 10 − 18 mild, 19 − 29 matg, 30 − 63 zware depressie
Onafankelijke variabele (X) (= voorspeller)
- Coping score
0 = geen coping, 10 = goed kunnen omgaan met tegenslag
2. Statetesc model
Relate tussen variabelen in de populate: yi = β0 + β1xi + i
- yi = score op afankelijke variabele y voor persoon i
- xi = score onafankelijke variabele x voor persoon i
- i = residu (error, afwijking)
Regressieco-fci-nten:
2
, - β0 = intercept
- β1 = helling (slope)
De regressieco-fci-nten moeten geschat worden (uit de steekproef).
Het statstsche model heef de vorm: data = model + error (deel dat je niet snapt, dus het stuk dat ze van de
lijn af liggen), waarbij
- data = yi
- model = β0 + β1xi (regressielijn)
- error = I (normaal verdeeld met gemiddelde 0)
Geschate vegvessielije
Je wilt iets zeggen over de populate, en hier probeer je schatngen voor te vinden.
Co-fci-nten
- β0 = intercept
- β1 = helling (slope)
zijn niet direct observeerbaar (populatelijn)
moeten geschat worden
gebeurt met kleinste kwadratenmethode
Geschate regressielijn is dan: yˆ i b0 b1 xi
- e0 = schater van β0
- e1 = schater van β1
- Voor gemak schrijven we: BDI = e0 + e1*coping
Vevgelijkieg lije
Dit zoals je het kent van de middelbare school.
Vergelijking voor een lijn: y = ax +e
waarbij e = intercept waarde van y als x = 0 (snijpunt y-as)
a = helling (slope) geef steilheid van de lijn
Geschate vegvessielije (zie plaatje)
BDI = e0 + e1*coping
e0 = interceptwaarde van BDI als coping = 0
e1 = helling (slope)geef steilheid van de lijn
e1 = –5.2 (dalend)
3. SPSS analyee
Zie powerpoint voor de plaatjes stappenplan van SPSS.
Stappenplan: analyze regression linear (dependent =
afankelijke variabele, independents = alle onafankelijke
variabelen) output = co-fci-ntentabel.
Unstandardized coefcients:
- waarde van e0 (= 54.3) bij Constant
- waarde van e1 (= – 5.2) bij coping
Invullen in BDI = e0 + e1*coping geef de geschate regressievergelijking: BDI = 54.3 – 5.2*coping
Populate-intercept:
t-toets voor populate-intercept
- H0: β0 = 0
Toets of populate-intercept ongelijk 0 is
- t = 30.3, p < 0.001 intercept waarschijnlijk ongelijk aan 0 in populate
3
, Als toets niet signifcant, niet een probleem (intercept is dan heel klein).
Populate regressieco-fci-nten:
t-toets voor populate regressieco-fci-nt van coping
- H0: β1 = 0
Toets of coping een voorspeller is van BDI in populate
- t = –16.7, p < 0.001
coping zeer waarschijnlijk een voorspeller van BDI
Oedevzoeksavaag 3
Onderzoeksvraag 3: Kan BDI voorspeld worden door coping?
Ja, uit t = –16.7, p < 0.001 volgt dat coping zeer waarschijnlijk een voorspeller is van BDI in de populate
Covvelatie
Beta (4e kolom tabel):
- Waarden van co-fci-nten als alle variabelen gestandaardiseerd zijn
- (Gestandaardiseerd: gemiddelde = 0 en standaarddeviate = 1)
- Standaardiseren vanwege het verschil in range op de schaal van beide variabelen (verschillende
antwoordschaal)
Als één voorspeller (bijvoorbeeld alleen coping als voorspeller van depressie): Beta = correlate = –0.880 tussen
BDI en coping
Regvessieaevgelijkieg
BDI = 54.3 – 5.2*coping
Interpretate (Tentamen!):
- Intercept: als helemaal geen coping (= 0) dan score BDI = 54.3
- 1 punt hogere score op coping dan afname van BDI met 5.2
punten
Vergelijking kan gebruikt worden om voorspellingen te doen.
Een persoon met coping score x = 5 heef een voorspelde waarde BDI =
54.3 – 5.2*5 = 28.3
Een persoon met coping score x = 8 heef een voorspelde waarde BDI = 54.3 – 5.2*8 = 12.7
4. Verklaarde variante
Hoe goed is het model?
R = multpele correlate
- Correlate tussen Y en alle voorspellers X1, X2, X3
- R2 is de verklaarde variante van Y door model met X1, X2, X3
Hier: één voorspeller (= coping)
- R = 0.880 is positeve correlate tussen BDI en coping
- R2 = 77.4% is variante van BDI verklaard door coping
- Dit is erg hoog! Vaak niet bij pedagogiek onderwerpen
Hoge R2
Als punten allemaal dicht bij de regressielijn.
- Veel kleinere residuen
- Hoge correlate tussen variabelen (BDI en coping)
- Hoge R2
- Veel verklaarde variante
Lage R2
4