Hoorcollege 4 MVDA
Logistic Regression Analysis (LRA)
Onderzoeksvraag:
Kan Y worden voorspelt door X1 en/of X2?
Meetniveaus:
De afhankelijke variabele Y is binair
Voorspellers zijn interval (of binair)
Binaire uitkomsten
Bij logistische regressieanalyse is de afhankelijke variabele binair.
Binaire uitkomsten komen vaak voor bij:
Recidive in het strafrecht
Sterfte of overleving in de volksgezondheid
Ziekte in de volksgezondheid
Afstudeercijfers in het onderwijs
Binaire uitkomsten zijn gemakkelijk te begrijpen als:
Proporties
Percentages
Logistische regressie wordt veel gebruikt.
Illustratief voorbeeld
Een onderwijspsycholoog vraagt zich af of het behalen van een tentamen kan
worden voorspelt uit het aantal studie-uren en aantal bijgewoonde colleges.
De psycholoog voert een onderzoek uit met 421 random geselecteerde
studenten:
- Laat studenten het examen doen
- Vraag studenten naar het aantal studie-uren
- Vraag de leerlingen naar het aantal bijgewoonde colleges
Predictoren zijn interval variabelen:
- Aantal studie-uren (1, 2, …, 70)
- Aantal bijgewoonde colleges (1, 2, …, 7)
Afhankelijke variabele is binair:
- Zakken (0) of slagen (1)
Scatterplot
Scatterplot van het aantal studie-uren en zakken/slagen:
, Hoorcollege 4 MVDA
Hoe zijn de variabelen gerelateerd?
Lineair fit
Regressielijn: beschrijft de data niet erg goed
Groepsproporties
Scatterplot van het aantal studie-uren en groepsproporties:
Informatiever als we:
Het aantal studie-uren verdelen in groepen
1-10, 11-20, …, 61-70
Bereken de proportie van slagen voor elke groep
S-vormige curve beschrijft een onderliggende relatie.
Niet-lineaire fit
, Hoorcollege 4 MVDA
Scatterplot van het aantal studie-uren en zakken/slagen:
Niet-lineaire curve:
Voorspelde scores zijn getallen tussen 0-1
Forceer regressielijn tussen 0 en 1
Werkt erg goed in de praktijk
Nummer e
Exponenttfunctie a n = c
a = base, n = power, c= resultaat
Voorbeeld: 23 = 2 · 2 · 2 = 8
Nummer e = 2.71828...
Beroemde wiskundige constante (symbool e komt van Euler)
Voordelen om e als basis te gebruiken
0
e =1
e 1 = 2.72
2
e = 7.39
e 3 = 20.09
n
e = exponentiele functie
Logistische functie
Logistic Regression Analysis (LRA)
Onderzoeksvraag:
Kan Y worden voorspelt door X1 en/of X2?
Meetniveaus:
De afhankelijke variabele Y is binair
Voorspellers zijn interval (of binair)
Binaire uitkomsten
Bij logistische regressieanalyse is de afhankelijke variabele binair.
Binaire uitkomsten komen vaak voor bij:
Recidive in het strafrecht
Sterfte of overleving in de volksgezondheid
Ziekte in de volksgezondheid
Afstudeercijfers in het onderwijs
Binaire uitkomsten zijn gemakkelijk te begrijpen als:
Proporties
Percentages
Logistische regressie wordt veel gebruikt.
Illustratief voorbeeld
Een onderwijspsycholoog vraagt zich af of het behalen van een tentamen kan
worden voorspelt uit het aantal studie-uren en aantal bijgewoonde colleges.
De psycholoog voert een onderzoek uit met 421 random geselecteerde
studenten:
- Laat studenten het examen doen
- Vraag studenten naar het aantal studie-uren
- Vraag de leerlingen naar het aantal bijgewoonde colleges
Predictoren zijn interval variabelen:
- Aantal studie-uren (1, 2, …, 70)
- Aantal bijgewoonde colleges (1, 2, …, 7)
Afhankelijke variabele is binair:
- Zakken (0) of slagen (1)
Scatterplot
Scatterplot van het aantal studie-uren en zakken/slagen:
, Hoorcollege 4 MVDA
Hoe zijn de variabelen gerelateerd?
Lineair fit
Regressielijn: beschrijft de data niet erg goed
Groepsproporties
Scatterplot van het aantal studie-uren en groepsproporties:
Informatiever als we:
Het aantal studie-uren verdelen in groepen
1-10, 11-20, …, 61-70
Bereken de proportie van slagen voor elke groep
S-vormige curve beschrijft een onderliggende relatie.
Niet-lineaire fit
, Hoorcollege 4 MVDA
Scatterplot van het aantal studie-uren en zakken/slagen:
Niet-lineaire curve:
Voorspelde scores zijn getallen tussen 0-1
Forceer regressielijn tussen 0 en 1
Werkt erg goed in de praktijk
Nummer e
Exponenttfunctie a n = c
a = base, n = power, c= resultaat
Voorbeeld: 23 = 2 · 2 · 2 = 8
Nummer e = 2.71828...
Beroemde wiskundige constante (symbool e komt van Euler)
Voordelen om e als basis te gebruiken
0
e =1
e 1 = 2.72
2
e = 7.39
e 3 = 20.09
n
e = exponentiele functie
Logistische functie