Controleer altijd de data:
- Vreemde waarden
- Hercoderen
- Schalen maken
- Select cases
Week 6, Hoofdstuk 8, hoofdstuk 6 BB: Meervoudige regressieanalyse
Regressieanalyse: doel: een voorspelling doen over de afhankelijke variabele (y), wanneer je
de waarde van de onafhankelijke variabele (x) invult het effect van x op y.
ŷ=a+bx
b is afhankelijk van de meeteenheid
- Sprake van een effect: asymmetrisch en controleren op kromlijnigheid
- Bij een enkelvoudige regressieanalyse is de significantie van een f-toets en een t-
toets gelijk aan elkaar. Hetzelfde geldt voor de gestandaardiseerde regressie
coëfficiënt (R/beta)
- Richting alleen door Beta/b
- Standaardiseren doe je met een z-score: om verschillende variabelen met elkaar te
vergelijken
Dichotoom betekent: twee waarden = 0 en 1 dummyvariabele. Let op! je blijft spreken van
een nominale (categorische) variabele na het hercoderen:
- Andere interpretatie: het gemiddelde verschil tussen de 0-categorie en de 1-categorie
- Bijvoorbeeld: gemiddelde is 0,6 dus 60% van de respondenten is vrouw
- Mag je als numeriek beschouwen
Meervoudige regressieanalyse: meerdere onafhankelijke variabelen, één afhankelijke
numerieke variabele (mag ook een samengestelde schaal zijn):
- ŷ = a + b1 x 1+ b2 x2 + b3 x3
- Onder constant houding van: als je kijkt naar één effect van een variabele, dus onder
constant houding van de overige twee variabelen
- Naar zuivere effecten kijken= gestandaardiseerde regressiecoëfficiënt geeft een
zuiver effect aan (-1/1) is een voordeel!
Voorwaarden:
- Minimaal één van de onafhankelijke variabele is numeriek, ook mogelijk één
numerieke variabele en andere variabelen zijn dichotoom
- Geen kromlijnig verband= spreidingsdiagram voor elke onafhankelijke variabele met
de afhankelijke variabele
Stappen:
1. H0: In de populatie kunne de twee variabelen samen niet de variantie in de
afhankelijke variabele verklaren
2. H1: In de populatie kan minimaal één variabele wel de variantie in de afhankelijke
variabele verklaren
3. Toetsgrootheid= F-toets motivatie: een afhankelijke numerieke variabele en twee
numerieke onafhankelijke variabele (andere variabelen mogen dichotoom zijn)
, 4. Significantieniveau, α= 0,05.
5. En 5. Voorwaarden voor toets controleren
6. (6) Het resultaat is significant
7. (7) Effectgrootte= R2 in procenten
Rapportage
1. Uit de toets op het hele regressiemodel bij een meervoudige regressieanalyse
blijkt dat de frequentie televisiekijken en de frequentie krant lezen onder senioren
een significante en redelijk sterke voorspeller is voor de frequentie dat over media
wordt gepraat,
2. F(2, 512) = 86,96, p < 0,001, R2 = 0,25. de variantie in frequentie krant lezen en
frequentie televisiekijken samen, verklaart voor 25,4% de variantie in de
frequentie over media praten.
R is de wortel van R2
Samengestelde schaal spss: compute MEAN (v1,v2,v3):
- Komma’s
- Minimaal 3 variabelen
- Alle variabelen moeten dezelfde aantal antwoord categorieën hebben
- Is altijd interval niveau
Toetsen op de regressielijn:
- Te zien in tabel Coefficients
- T-toets
- Aflezen en interpreteren per onafhankelijke variabele
- Significant verband op het hele model, per lijn bekijken 3 onafhankelijke
variabelen, dus ook 3 lijnen en 3 nulhypothesen, conclusie per lijn.
- Welke variabele het sterkste effect heeft, min of plus maakt niet uit.
- Alleen interpretatie van de variabelen die significant zijn.
1. Uit een toets op een regressielijn, blijkt dat er een significant en redelijk sterk en
positief effect is van frequentie televisiekijken op de frequentie over media praten,
b* = 0,36, t = 8,70, p < 0,001, 95% CI [0,33, 0,52]. Hoe vaker de senioren
televisiekijken, hoe vaker zij over media praten, onder constant houding van de
frequentie dat zij een krant lezen.
Let op deze rapportage moet voor elke onafhankelijke variabele.