Afwezigheid uitschieters:
Met spreidingsdiagram of boxplot bekijken.
Formeel:
Residuals Statistics tabel bekijk minimum en maximum waardes van de
o Standardized residuals
Controle uitschieters Y-ruimte
waardes moeten binnen -3.3 en 3.3
vallen
o Mahalanobis Distance
Controle uitschieters X-ruimte
moet lager zijn dan
10 + 2(aaantal onaf. Var.)
o Cook’s Distance.
Controle uitschieters XY-ruimte
lager dan 1
(hoger dan 1 duidt op invloedrijke
respondenten (influential cases))
Uitschieters niet meenemen in analyse als:
o De participant niet behoort tot een groep waarover je uitspraken wil doen.
o De extreme waarden van een participant theoretisch niet mogelijk zijn
Afwezigheid multicollineariteit de variabelen correleren:
Coefficients tabel laatste twee kolommen
o Tolerance
< 1 probleem, < 2 mogelijk probleem
o VIF (= 1/tolerance)
> 10 probleem
Als je te sterk gerelateerde variabelen opneemt in je model heeft dat drie gevolgen:
o De regressiecoëfficiënten (B) zijn onbetrouwbaar.
o Het beperkt de grootte van R (de correlatie tussen Y en Ŷ)
o Het belang van individuele onafhankelijke variabelen is niet/moeilijk vast te stellen.
Homoscedasticiteit De spreiding van de residuen per X-
waarde moeten ongeveer gelijk zijn:
Scatterplot
Als er voor elke voorspelde waarde (X-as) ongeveer evenveel
spreiding is op de Y-as, dan is
er voldaan aan de voorwaarde.
,Normaal verdeelde residuen:
Histogram
Bekijk of het histogram ongeveer de lijn van de
normaalverdeling volgt.
Analyseplan. De analyses zullen wordt uitgevoerd in de Statistical Package of Social
Siences SPSS (versie 26). Negatieve en positieve disciplinering worden als de onafhankelijke
variabelen beschouwd. Gender fungeert als moderator en adaptief gedrag als afhankelijke
variabele. De moderator is een dichotome variabele (0=? en 1=?) en zowel de onafhankelijke
als de afhankelijke variabelen zijn continu.
Allereerst wordt het databestand op uitschieters gecontroleerd door middel van een
boxplot. Vervolgens moet worden vastgesteld of er een verband is tussen positieve en
negatieve disciplinering, adaptief gedrag en gender. Om dit te meten, wordt een tweezijdige
Pearsoncorrelatiecoëfficiënt (r) berekend met α=.05.
Het effect van gender als moderator zal met een hiërarchische regressie met interactie-
effect worden onderzocht. Hiervoor zullen eerst de onafhankelijke variabelen gecentreerd
worden. Vervolgens wordt de interactieterm gecreëerd door de gecentreerde variabelen met
de moderator te vermenigvuldigen (Negdisciplinering_C * gender en Posdisciplinering_C *
gender). De data wordt op uitschieters gecontroleerd door bij het uitvoeren van de
regressieanalyse de uitschieters in de X-ruimte (Mahalanobis Distance), Y-ruimte
(Standardized residuals) en de XY-ruimte (Cook’s Distance) te controleren. Extreme waarden
worden uit de dataset verwijderd als ze theoretisch niet mogelijk zijn. Eventuele problemen
met de multicollineariteit worden verholpen door het centreren van de variabelen (Field,
2018). Om dit na te gaan, wordt de VIF en de Tollerance gecontroleerd. Verder wordt de
homoscedasticiteit gecontroleerd door middel van een scatterplot en de normaalverdeling met
een histogram.
Er worden twee hiërarchie regressies uitgevoerd die elk twee stappen tellen. De eerste
analyse wordt uitgevoerd voor positieve disciplinering en de tweede voor negatieve
disciplinering. Achtereenvolgens wordt de gecentreerde onafhankelijke variabele en de
interactieterm ingevoerd.
,
, Multipele regressie
Een voorwaarde voor een multipele regressieanalyse is dat de afhankelijke variabele minimaal van
interval meetniveau is.
1. Meetniveau
a. Is afhankelijke variabele van interval/ratio meetniveau?
b. Zijn de onafhankelijke variabele interval/ratio meetniveau of dichotoom?
2. Lineair verband : Is er een lineair verband tussen de afhankelijke variabele en alle
kwantitatieve onafhankelijke variabelen?
3. Afwezigheid van uitschieters
Graphs Chartbuilder Scatterplot
Y-as afhankelijke variabele
X-as steeds een andere onafhankelijke variabele
Age Gender Sports
Support parents Support teachers SES
kwartet van Anscombe: vier datatsets met allemaal dezelfde statistische eigenschappen De
variabelen X en Y hebben in alle datasets hetzelfde gemiddelde en dezelfde variantie. Ook is
de correlatie en regressielijn voor alle datasets gelijk.