Samenvatting + berekeningen
Modelkeuze
Onafhankelijke variaeele Afhankelijke variaeele Model
X1 X2 Y
DUM INT t-toets voor
onafankelijke groepen
NOM INT Éénwegvarianteanalyse
(ANOVA)
NOM NOM INT Tweewegvarianteanalys
e (ANOVA)
INT INT Enkelvoudige
regressieanalyse
INT INT INT Multpele
regressieanalyse
INT NOM INT Covarianteanalyse
INT DUM DUM Logistssce
regressieanalyse
Vooreeeld lineaire (enkelvoudige) regressieanalyse
In een onderzoek bij 270 kinderen naar cun sscoolprestate worden naast cet intellestueel vermogen van cet
kind, ook de mate van belangstelling van cet kind, van cun ouders en van cun leerkrascten gemeten. De
belangstellingsvragenlijst voor ouders en voor leerkrascten bevat dezelfde 12 items, met itemssores op een 7-
puntssscaal. De somssore van deze items levert een maat voor belangstelling op. Een onderwijskundige vraagt
zisc af of de belangstelling van een kind kan worden voorspeld uit de belangstelling van de ouders en de
belangstelling van de leerkrasct.
Vooreeeld t-toets voor gepaarde waarnemingen
De onderwijskundige van voorbeeld ciervoor vraagt zisc ook af of ouders meer belangstellend zijn dan
leerkrascten.
Vooreeeld varianteanalyse
Bij een bevolkingsonderzoek naar de kwaliteit van kindergebiten werd onder andere gekeken naar de mate
van gebitsaantastng door sariës (op een sscaal van 0 tot 100). Een ortcopedagoge wil weten of sariëssscade
bij Surinaamse kinderen kleiner en bij Marokkaanse kinderen groter is dan bij Nederlandse kinderen.
Vooreeeld covarianteanalyse
Bij een bevolkingsonderzoek naar de kwaliteit van kindergebiten werd onder andere gekeken naar de mate
van gebitsaantastng door sariës (op een sscaal van 0 tot 100). Een ortcopedagoge wil weten of de
sariëssscade bij Surinaamse kinderen lager en bij Marokkaanse kinderen coger is dan bij Nederlandse kinderen,
als rekening wordt gecouden met cet gezinsinkomen (in Euro’s per jaar).
Vooreeeld logistsche regressieanalyse
Een statstsus leest in de krant dat zilverkleurige auto’s minder vaak bij ongelukken betrokken zijn dan auto’s
met een andere kleur. De statstsus wil weten of cet al dan niet optreden van een ongeluk voorspeld kan
worden uit de kleur van de auto, rekening coudend met de leefijd van de scaufeur en de prijs van de auto.
1
, Werkcollege 1 Regressieanalyse
Wat is de regressieanalyse?
De regressieanalyse kijkt of er een (voorspellend verband is. Dit wordt gedaan op basis van de sorrelate van de
onafankelijke variabele en de afankelijke variabele. De regressie wordt gebruikt om cypotceses te toetsen.
De enkelvoudige regressie analyse maakt gebruik van sontnue data (sscaalvariabelen).
Je gebruikt de regressie analyse om te toetsen of een onafankelijke variabele invloed ceef op een
afankelijke variabele. Tevens wordt getest of dit een positef of een negatef efest is.
Voorbeeld: Je wilt onderzoeken of intelligente (onafankelijk) invloed ceef op cet tentamensijfer
(afankelijk). Je toetst dan de cypotcese: Hooe coger de intelligente coe coger cet tentamensijfer (of
intelligente ceef een positeve invloed op cet tentamensijfer).
Afhankelijke en onafhankelijke variaeelen
Deze moet je kunnen bepalen.
Afankelijke variabele de variabele waarover men een voorspelling doet. Voorbeeld: jaarinkomen.
Onafankelijke variabele de voorspeller. Voorbeeld: opleidingsniveau.
In deze voorbeelden wordt de rol van de variabele voornamelijk bepaald door de tjdvolgorde.
Vooreeeld output Regressieanalyse
Steekproefgroote
Deze kan je op versscillende manieren bepalen:
- Kijken wat er wordt gezegd in de tekst
- ANOVA tabel: totaal aantal vrijceidsgraden + 1
Hypotheses eij t-toets score eehorende tot onafhankelijke variaeele
Ho0 : β 0, in de populate is de regressiesoëfsiënt van [onafankelijke variabele] gelijk aan 0;
Hoa : β ≠ 0, in de populate is de regressiesoëfsiënt van [onafankelijke variabele] ongelijk aan 0.
Bepalen of onafhankelijke variaeele een signifcante voorspeller is van de afhankelijke variaeele
Kijk in de Coefsients tabel op de rij van de onafankelijke variabele naar de kolommen ‘t’ en ‘sig.’
Rapporteer vervolgens de t-waarde en de p-waarde waarbij je vermeldt of deze signifsant is op α 0.05 of
niet.
Geschate regressievergelijking
[Afankelijke variabele] b0 + b1*[onafankelijke variabele] Y b0 + b1X1
Vul de variabelen in. Kijk voor b0 en b1 in de soefsients tabel – unstandardized soefsients - B
Bo B in de rij ‘sonstante’
B1 B in de rij van de onafankelijke variabele
Dit is uit te breiden voor meerdere onafankelijke variabelen: Y b 0 + b1X1 + b2X2
Door middel van de gesscate regressievergelijking kan je voorspelde waarden voor de afankelijke variabele
en onafankelijke variabele berekenen als dit gevraagd wordt.
2