Statistische modellen 2
College 1
3 soorten variabelen
=
⁃ NOM: nominaal, ‘labels’ zoals haarkleuren bv, zit geen rangorde in
⁃ DUM: dummyvariabelen: 0 en 1 (2 groepen)
⁃ INT: interval / kwantitatieve variabele —> lengte leeftijd, gewicht
‘depressie’, ‘coming’, vaardigheidsscore
Wat doet een t-toets
=
2 variabelen vergelijken op een intervariabele —> 6 en 7 jarige (DUM)
vergelijken voor lengte (interval)
Hoe wordt een lijn beschreven
=
Door een helling
Wat vertelt de helling
=
Richting van relatie en interpretatie van de relatie
Wat zijn residuen
=
Kleinste kwadraten som
⁃ Afstanden punten tot de lijn
Wat is de passende beste lijn
=
Kleinste kwadraten som
⁃ Waar alle residuen minimaal zijn
Wat voor 2 voordelen genereer je door de passende lijn
=
1. Je behandelt negatieve en positieve waarden hetzelfde
2. En je straft de punten die nog verder er van afgooien
Wat zegt Pearson correlatie
=
Maat voor sterkte lineaire relatie
,Bijbehorende nulhypothese
=
H0: r = 0 (geen relatie)
Wat wil significantie zeggen
=
Zo ja, onwaarschijnlijk om in de werkelijkheid geen verband te vinden
Mate vakbijzonderheid = p-waarde
Type toetsen
=
1. Rechtszijde toets —> B > 0
2. Linkerzijde toets —> B < 0
3. Tweezijdige toets —>B =/ 0
=
Schatting uit de steekproef —> waarde die je gevonden hebt (bv
gemiddelde)
Waarde onder H0 —> verwachte waarde in de populatie (bv u = 0 )
Standaardfout SE —> hoe sterk de schatting uit steekproef kan
variëren
==> toetsingsgrootheid
Wat betekent toetsingsgrootheid
=
Hoeveel standaardfouten ligt gevonden uitkomst van de
waarde van H0 af
Hoe groter, hoe kleiner de kans dat het gevonden verschil op toeval
berust
⁃ Die kans noemen we p-waarde
⁃ Kans beekenen hoe bijzonder het is wat we gevonden hebben
Wat is precieze betekenis p-waarde
, =
Wat is de kans op minstens de gevolgen toetsingsgrofte te vinden
indien H0 waar zou zijn
Hoe kleiner de p…
=
Hoe sterker bewijs je hebt tegen H0
P<a
=
Er lijkt bewijs te zijn tegen nulhypothese (hoeft niet sterk te zijn)
P>a
=
Geen idee of er een populatie-effect is —> NIET er is geen populatie
effect
Relatie tussen variabelen in de populatie
=
Y1 = score op afhankelijke variabele
X1 = score op onafhankelijke variabele
E1 = error
B0 = intercept, snijpunt daar waar de y-as wordt gesneden
B1 = helling
Wat is een geschatte regressielijn
=
Normale b is dus een schatter
Wat is het intercept
=
B0 —> als b1 = 0 dan is dat de waarde
Wat zegt de helling
=
B1 —> geeft steilheid aan de lijn
Wat is homoscedasticiteit
College 1
3 soorten variabelen
=
⁃ NOM: nominaal, ‘labels’ zoals haarkleuren bv, zit geen rangorde in
⁃ DUM: dummyvariabelen: 0 en 1 (2 groepen)
⁃ INT: interval / kwantitatieve variabele —> lengte leeftijd, gewicht
‘depressie’, ‘coming’, vaardigheidsscore
Wat doet een t-toets
=
2 variabelen vergelijken op een intervariabele —> 6 en 7 jarige (DUM)
vergelijken voor lengte (interval)
Hoe wordt een lijn beschreven
=
Door een helling
Wat vertelt de helling
=
Richting van relatie en interpretatie van de relatie
Wat zijn residuen
=
Kleinste kwadraten som
⁃ Afstanden punten tot de lijn
Wat is de passende beste lijn
=
Kleinste kwadraten som
⁃ Waar alle residuen minimaal zijn
Wat voor 2 voordelen genereer je door de passende lijn
=
1. Je behandelt negatieve en positieve waarden hetzelfde
2. En je straft de punten die nog verder er van afgooien
Wat zegt Pearson correlatie
=
Maat voor sterkte lineaire relatie
,Bijbehorende nulhypothese
=
H0: r = 0 (geen relatie)
Wat wil significantie zeggen
=
Zo ja, onwaarschijnlijk om in de werkelijkheid geen verband te vinden
Mate vakbijzonderheid = p-waarde
Type toetsen
=
1. Rechtszijde toets —> B > 0
2. Linkerzijde toets —> B < 0
3. Tweezijdige toets —>B =/ 0
=
Schatting uit de steekproef —> waarde die je gevonden hebt (bv
gemiddelde)
Waarde onder H0 —> verwachte waarde in de populatie (bv u = 0 )
Standaardfout SE —> hoe sterk de schatting uit steekproef kan
variëren
==> toetsingsgrootheid
Wat betekent toetsingsgrootheid
=
Hoeveel standaardfouten ligt gevonden uitkomst van de
waarde van H0 af
Hoe groter, hoe kleiner de kans dat het gevonden verschil op toeval
berust
⁃ Die kans noemen we p-waarde
⁃ Kans beekenen hoe bijzonder het is wat we gevonden hebben
Wat is precieze betekenis p-waarde
, =
Wat is de kans op minstens de gevolgen toetsingsgrofte te vinden
indien H0 waar zou zijn
Hoe kleiner de p…
=
Hoe sterker bewijs je hebt tegen H0
P<a
=
Er lijkt bewijs te zijn tegen nulhypothese (hoeft niet sterk te zijn)
P>a
=
Geen idee of er een populatie-effect is —> NIET er is geen populatie
effect
Relatie tussen variabelen in de populatie
=
Y1 = score op afhankelijke variabele
X1 = score op onafhankelijke variabele
E1 = error
B0 = intercept, snijpunt daar waar de y-as wordt gesneden
B1 = helling
Wat is een geschatte regressielijn
=
Normale b is dus een schatter
Wat is het intercept
=
B0 —> als b1 = 0 dan is dat de waarde
Wat zegt de helling
=
B1 —> geeft steilheid aan de lijn
Wat is homoscedasticiteit