Geschreven door studenten die geslaagd zijn Direct beschikbaar na je betaling Online lezen of als PDF Verkeerd document? Gratis ruilen 4,6 TrustPilot
logo-home
Samenvatting

Samenvatting en uitwerkingen - 4.4P Statistische vaardigheden III (FSWPE-M047)

Beoordeling
4.5
(2)
Verkocht
21
Pagina's
71
Geüpload op
13-02-2025
Geschreven in
2024/2025

Samenvatting van de SPSS college's inclusief stappen voor de analyses in SPSS en uitleg over bepaalde concepten. Daarnaast heb ik alle sessies uitgewerkt. In de antwoorden staan de outputs, de antwoorden en uitleg over het antwoord. Met deze samenvatting heb ik zelf voor dit tentamen een 9.5 gehaald.

Meer zien Lees minder
Instelling
Vak

Voorbeeld van de inhoud

4.4P STATISTISCHE
VAARDIGHEDEN
SESSIE 1

COLLEGE 1: DATA SCREENING

Outliers zijn waarden die significant afwijken van andere waarnemingen. Ze kunnen de resultaten
beïnvloeden

Outlier detection:

- Gebruik histogrammen: Histogrammen (univariate) en scatterplots (bivariate)
- Outliers in Y-space (enkel afhankelijke variabelen): standardized residuals (z-score die we niet
hebben kunnen verklaren in ons model)
o Regel: moet tussen -3 en 3 zijn
- Outliers in X-space (enkel onafhankelijke variabelen): mahalanobis distance
- Outliers in XY-space (beide afhankelijke en onafhankelijke variabelen): cook’s distance
o Regel: cook’s distance < 1

Cook’s distance: algemene maat voor de invloed van een punt op de waarden van de
regressiecoëfficiënten

- Cook’s distance zou <1 moeten zijn

Mahalanobis distance: controleert op outliers op voorspellende variabelen (onafhankelijke variabele)

- N = 500, dan zou Mahalanobis <20-25 moeten zijn
- N = 100, dan zou Mahalanobis <15 moeten zijn
- N = 30, dan zou Mahalanobis <11 moeten zijn
 Je kan eventueel kijken naar de onderstaande tabel voor hoe groot de Mahalanobis distance
maximaal mag zijn




1

,Histogram maken

1 Graphs
2 Histograms
3 Variable: voer je afhankelijke variabele in (of een andere variabele)
4 Ok
Kijken of je histogram normaal verdeeld is
Scatterplot (stap 4)

1 Graphs
2 Scatter/Dot
3 Simple scatter
4 y-as: afhankelijke variabele
5 x-as: onafhankelijke variabele
6 Ok
Een outlier is een waarde die erg afwijkt van de rest van de waardes
Voor lineairiteit
7 Dubbel klik output
8 Add fit line at total
9 Quadratic
10 Apply
Wanneer er een groot verschil zit tussen de lineaire lijn en de quadratic lijn, is er geen sprake van
lineariteit
Mahalanobis distance, cook’s distance en standardized residuals (stap 2)

1 Analyze
2 Regression
3 Lineair
4 Dependent: afhankelijke variabele invoeren
5 Independent(s): onafhankelijke variabele invoegen
6 Save


2

, 7 Residuals: standardized
8 Distances: Mahalanobis en Cook’s
9 Continue
10 Ok
Standardized residual: te zien in de output (regel: tussen -3 en 3)
Normaliteit (stap 3)

1 Analyze
2 Descriptive statistics
3 Q-Q plots
4 Variables: standardized residuals
5 Ok
Als een model normaal verdeeld is, lopen de punten op of dicht rond te lijn
Het controleren van de assumpties voor een regressieanalyse is essentieel om ervoor te zorgen dat
de resultaten van de analyse geldig en betrouwbaar zijn. Als de assumpties niet worden voldaan,
kunnen de resultaten vertekend of misleidend zijn. De belangrijkste aannames voor een lineaire
regressie staan in de volgende stappen.

Stappen assumpties checken:

1. Measurement level of the variables
2. Check for outliers
a. Standardized residuals met een waarde groter dan 3.29 (of 3) zijn een reden tot zorg
b. Als meer dan 1% van de sample cases een residual boven 2.58 heeft (of 2.5) is er
reden tot zorg
c. Als meer dan 5% van de sample cases een residual boven 1.96 heeft (of 2) is er reden
tot zorg
3. Normality assumption
a. Normaliteit hoeft niet per sé gecheckt te worden wanneer n > 30 per groep is
(moeten wel even grote groepen zijn)
4. Linerariteit
5. Homogeneity assumption
6. Multicollinearity
7. Check Quality of prediction
a. Kijken naar R2 of deze wel hoog genoeg is (R2 = 0,335 is al goed)

Snel kijken of er onmogelijk waardes zijn en of Mahalanobis en Cook’s te groot zijn

1 Analyze
2 Descriptive statistics
3 Descriptives
4 Variables: Alle variabelen invoeren waar je naar wil kijken, incl. Mahalanobis distance en
Cook’s distance
5 Options: minimum en maximum
6 Ok
Sample size

- Aantal subject voor een betrouwbaar model

3

, o 10-15 cases per voorspeller
- Aantal cases voor adequate power (.80)
o Green (1991):
 50+8*aantal voorspellers voor de nullhypothese
 104+aatal voorspellers voor specifieke hypotheses
o Hoe kleiner het verwachte effect (R2) en hoe meer voorspellers in het model, hoe
groter N moet zijn voor een betrouwbare voorspelling en adequate power (.80)

Homogeneity assumption checken (stap 5)

1 Analyse
2 Regression
3 Lineair
4 Variabelen invoegen
5 Save
6 Predicted values: Unstandardized
7 Residuals: standardized
8 Ok
9 Graphs
10 Scatter/Dot
11 Simple scatter
12 Y-axis: Standardized residuals
13 X-axis: unstandardized predicted values
14 Ok
Wanneer alle waardes random verdeeld zijn is er geen schending van homogeneity
Multicollinearity checken (bij >2 voorspellers, stap 6)

1 Analyze
2 Correlate
3 Bivariate
4 Variabelen invoegen
5 Ok
6 Regression
7 Lineair
8 Variabelen invoegen
9 Statistics
10 Multicollinearity diagnostics
11 Ok
12 In tabel “coefficients” rij met: collinearity statistics
Wanneer een correlatie hoger is dan 0.80 of 0.90 en Tolerance < 0.10/VIF > 10, is de assumptie van
multicollinearity geschonden
COLLEGE 2: DIAGNOSTICS IN REGRESSION

Hierarchical Regression: wordt gebruikt wanneer je de effecten van verschillende groepen van
variabelen op een afhankelijke variabele wilt onderzoeken, terwijl je de effecten van eerdere
variabelen in het model controleert

1 Analyze
2 Regression

4

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Geüpload op
13 februari 2025
Aantal pagina's
71
Geschreven in
2024/2025
Type
SAMENVATTING

Onderwerpen

$9.57
Krijg toegang tot het volledige document:

Verkeerd document? Gratis ruilen Binnen 14 dagen na aankoop en voor het downloaden kun je een ander document kiezen. Je kunt het bedrag gewoon opnieuw besteden.
Geschreven door studenten die geslaagd zijn
Direct beschikbaar na je betaling
Online lezen of als PDF

Beoordelingen van geverifieerde kopers

Alle 2 reviews worden weergegeven
3 maanden geleden

1 jaar geleden

4.5

2 beoordelingen

5
1
4
1
3
0
2
0
1
0
Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
naomilockefeer
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
21
Lid sinds
5 jaar
Aantal volgers
0
Documenten
6
Laatst verkocht
3 maanden geleden

4.5

2 beoordelingen

5
1
4
1
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Bezig met je bronvermelding?

Maak nauwkeurige citaten in APA, MLA en Harvard met onze gratis bronnengenerator.

Bezig met je bronvermelding?

Veelgestelde vragen