Tentamen (uitwerkingen)

Tentamen (uitwerkingen) Methoden & statistiek III (FSWPE-M041) Discovering Statistics Using IBM SPSS

Beoordeling

Verkocht

Pagina's

Cijfer

7-8

Geüpload op

11-02-2026

Geschreven in

2025/2026

Tijdens het vak moesten we exercises maken en antwoord geven op de vragen. Ik heb een samenvatting gemaakt van alle relevante informatie die aan bod kwam in de antwoorden op de opdrachten. Ik heb hiermee een 7 gehaald op het tentamen.

Meer zien Lees minder

Instelling

Vak

Voorbeeld van de inhoud

TENTAMEN METHODES EN STATISTIEK – WEEK 1
Hoge R square betekent niet dat er geen fouten zitten in de data → kunnen alsnog outliers
zijn dus altijd eerst je scatterplot maken

Hoe zie je of R square sterk, moderate of zwak is in een scatterplot?
- Als de puntjes allemaal dicht bij de lijn liggen dan zal je effectsize erg groot zijn en
daarmee sterk

ANOVAa
Sum of Mean
Model Squares df Square F Sig.
1 Regression 8.584 2 4.292 7.476 <.001b
Residual 126.879 221 .574
Total 135.463 223
a. Dependent Variable: Grade Point Average
b. Predictors: (Constant), SAT: mathematics part, SAT: verbal part

R square = SS regression/ SS total = 8.584/ 135.463

F = Mean Square regression / Mean square residual = 4.292/ 0.574 = 7.476

Wat betekent het als je R square heel hoog is maar je F-toets niet significant?
- Dit heeft te maken met je steekproef als die heel klein is dan is het moeilijk om
een effect te vinden ondanks dat de R square groot is.

Hoe zie je of een vergelijking/formule het beste het patroon van geobserveerde data laat
zien in een scatterplot?
- Als je ziet dat de data ongeveer in een lijn loopt. Zou lineair kunnen zijn namelijk.
Maar als je een wolkje of iets ziet met een uitschieter dan past dat niet bij
geobserveerde data.
- Elk stipje in een scatterplot staat voor een geobserveerde waarde van een
deelnemer.

OUTLIERS VERWIJDEREN
Wat is een outlier?
- Dit is een score die heel erg afwijkt van de rest van de data. Je moet hierop alert
zijn want het model kan daardoor verkeerde uitkomsten geven.
- Dit wordt ook wel bias genoemd. Dit kan je checken op 2 manieren:
o Residu statistiek → hoever de punt van de lijn ligt
o Influence statistiek → laat zien hoeveel invloed een punt heeft op het
model zoals Cook’s distance of Mahalanobis

1

,Casewise Diagnostics → tabel die gaat over residuen (errors) in de steekproef. Je kan zien
wat een outlier was. Je kijkt bij tabel Y4. Case 11 is de outlier want die past niet bij de rest
van de
waarden.

Case

Summaries → tabel die info geeft over welke cases mogelijk invloed hebben. Dus hoeveel
invloed heeft elke persoon/case op het regressiemodel? Hoe sterk zou het model
veranderen als we die case eruit zouden halen?

Cook’s distance → veranderd het regressie model als ik deze case verwijder? Als die groter is
dan 1 dan heeft de case invloed

Leverage → ligt deze persoon extreem op de x-as. Als je heel erg links of rechts dan is de
leverage hoog. Een punt kan dan de regressie naar zich toe trekken. Je maakt een range

2

,2 x (k +1)/n en 3 x (k+1)/n → k = aantal voorspellers, N = steekproefgrootte

Mahalanobis distance → Ligt deze persoon ver van het wolkje dus ver van de gemiddelde x-
waarden. Hoe groter die is hoe verder weg het stipje van het wolkje ligt.

DFB0_1 → hoe veranderd de constante als je de specifieke case verwijderd
DFB1_1 → hoe verwijderd de helling als je de specifieke case verwijderd
DFF_1 → hoeveel gaat de voorspelling erop vooruit als je de case verwijderd.

Een invloedrijke case hoeft niet de grootste residual te hebben. Je gaat er zo mee om:
- Eerst begrijpen waarom een case extreem is. Je mag niet zomaar iets verwijderen
en ook niet zeggen van Oh de Cook’s is hoog dus ik verwijder het. Je moet echt
weten welke variabel het is en of het misschien een combi is.
→ 3 mogelijke oorzaken/uitkomsten voor een outlier:
1. Het is oprecht een fout zoals een typefoutje. Dit kan je nog corrigeren.
2. Je persoon hoort niet tot de doelgroep. Stel je onderzoekt angstklachten en je hebt
iemand met psychose dan mag je deze persoon gewoon verwijderen.
3. De persoon hoort wel bij de doelgroep maar heeft gewoon extreme scores.
→ Je kan de scores minder extreem maken of verwijderen maar wat je ook kiest, je moet
altijd alles wat je doet kunnen uitleggen. Waarom doe je iets of waarom heb je dat zo
gedaan?

Wat is het verschil tussen unstandardized en standardized residuals? En wat is het voordeel?
- Ongestandaardiseerd →
o Dit zijn voorspellingsfouten gemeten in verschillende eenheden of
hetzelfde als de Y dus in euro’s of kilo’s.
- Gestandaardiseerd →
o Dit zijn de z-scores van de voorspellingsfouten in standaarddeviaties
waardoor je kan zeggen of de fout groot is ten opzichte van de rest van de
data.

3 vuistregels om te bepalen welke case een outlier is, volgens gestandaardiseerde residuals:
1. Een fout die meer is dan 3 standaarddeviaties
2. Meer dan 1% van de cases heeft een residu van 2,5 of hoger
3. Meer dan 5% van de cases heeft een residu van 2 of meer

MULTICOLLINEARITEIT
Voorbeeld van tegenstijdigheid tussen de b’s en de correlaties tussen de variabelen:
- Als de correlaties in de plus zijn dan wil dat zeggen dat als X toeneemt dat Y dat
ook doet. Maar als je regressie coefficienten/ b’s negatief zijn dan lijkt het juist
alsof ze dalen waardoor ze elkaar tegenspreken.

3

, Multicollineariteit → 2 of meerdere voorspellers in het model lijken zo sterk op elkaar dat ze
bijna hetzelfde meten.

3 manieren om multicollineariteit te checken:
1. Correlatie is groter dan 0.800 of 0.900
2. De tollerance is kleiner dan 0.100
3. De VIF is groter dan 10

Probleem met multicollineariteit:
1. Bouncing b’s → De b’s/helling geeft per variabel aan wat het effect is maar als de
voorspellers bijna hetzelfde zijn dan weet het model niet meer wie wat doet
waardoor de b’s kunnen schommelen. Ze kunnen daardoor negatief worden terwijl
de correlatie positief is. Hierdoor zijn de b’s niet betrouwbaar.
2. Het model wordt niet beter → Doordat voorspellers op elkaar lijken voegt de nieuwe
voorspeller bijna niks nieuws toe waardoor de verklaarde variantie R square niet toe
neemt en bijna hetzelfde blijft.
3. Doordat je b’s onbetrouwbaar zijn kun je niet bepalen welke voorspeller belangrijker
is → de b’s en beta’s kan je niet meer vergelijken omdat je niet meer weet wie wat
doet

4

Meld schending auteursrecht

Gekoppeld boek

Andy Field Discovering Statistics Using IBM SPSS

Uitgave:2017
ISBN:9781526419514
Druk:Onbekend

Geschreven voor

Instelling: Erasmus Universiteit Rotterdam (EUR)
Studie: Arbeids en Organisatiepsychologie
Vak: Methoden & statistiek III (FSWPEM041)

Alle documenten voor dit vak (2)

Documentinformatie

Geüpload op: 11 februari 2026
Aantal pagina's: 33
Geschreven in: 2025/2026
Type: Tentamen (uitwerkingen)
Bevat: Vragen en antwoorden

Onderwerpen

ancova
anova
regressie analyse
mixed anova
repeated measure anova
hiërarchische regressie
statistiek

$10.38

Krijg toegang tot het volledige document:

Geschreven door studenten die geslaagd zijn

Direct beschikbaar na je betaling

Online lezen of als PDF

Maak kennis met de verkoper

sanjanabridjmohan

3.1

(12)

Maak kennis met de verkoper

sanjanabridjmohan Erasmus Universiteit Rotterdam

Bekijk profiel

Volgen

Verkocht

Lid sinds

5 jaar

Aantal volgers

Documenten

Laatst verkocht

2 jaar geleden

3.1

12 beoordelingen

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper sanjanabridjmohan. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor $10.38. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews) Afgelopen 30 dagen zijn er 51772 samenvattingen verkocht Opgericht in 2010, al 16 jaar dé plek om samenvattingen te kopen

Tentamen (uitwerkingen) Methoden & statistiek III (FSWPE-M041) Discovering Statistics Using IBM SPSS

Voorbeeld van de inhoud

Gekoppeld boek

Geschreven voor

Documentinformatie

Onderwerpen

Maak kennis met de verkoper

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Niet tevreden? Kies een ander document

Betaal zoals je wilt, start meteen met leren

Bezig met je bronvermelding?

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Tevredenheidsgarantie: hoe werkt dat?

Van wie koop ik deze samenvatting?

Zit ik meteen vast aan een abonnement?

Is Stuvia te vertrouwen?