H7: CORRELATION
7.2 MODELLING RELATIONSHIPS
Outcome = model + error
Data die we observeren kan worden voorspelt aan de hand van het model die we kiezen + een beetje
ruis die daarbij komt kijken. Als we een relatie willen weergeven tussen twee variabelen proberen we
een uitkomst variabele te voorspellen op basis van een onafhankelijke variabele.
Outome = (bX) + error
De onafhankelijke variabelen worden geschreven als X, b representeert de relatie tussen de
onafhankelijke variabele (X) en de uitkomst (afhankelijke)
b vertelt ons hoe sterk de relatie is tussen de uitkomst en de voorspellende variabelen.
als er één voorspellende (onafhankelijke variabele) in het model is, is b de Pearson-product-
moment correlatie (en wordt het geschreven als r)
7.2.1 A detour into the murky world of covariance
De makkelijkste manier om te kijken of twee variabelen geassocieerd zijn is om te kijken of ze
Covariëren.
Om te kijken naar de covariantie, kijk je naar de volgende dingen;
o als er een relatie bestaat = Als een variabele afwijkt van zijn gemiddelde, moet de
andere variabele ook afwijken van zijn gemiddelde op dezelfde of precies de
tegenovergestelde manier.verandering in de ene variabele gaat gepaard met een
verandering in een andere variabele
o deviatie = verschil geobserveerde waarde en gemiddelde
relatie berekenen = cross-product deviatie (deviaties met elkaar vermenigvuldigen)
covariantie = (xi-gemx)(yi-gemy) / N-1
N = aantal observaties
De covariantie is een geode manier om te kijken of twee variabelen gerelateerd aan elkaar zijn;
Als er een positieve relatie is dan is de covariantie positief, als er een negatieve relatie is dan is de
covariantie negatief. Je kunt de covariantie alleen maar gebruiken als de variabelen hetzelfde
gemeten zijn (met dezelfde schaal).
geen gestandaardiseerde maat dus!
7.2.2 Standardization and the correlation coefficient
Om het probleem van afhankelijkheid van de meetschaal te overkomen, moet je de covariantie in
een standaard set van eenheden omzetten; dit proces heet standaardisatie
Standaardisatie = xi – gemx / sd
- berekenen van gestandaardiseerde covariantie omdat je dan geen last heb van de
verschillende schalen
- gestandaardiseerde covariantie = correlatie coëfficiënt (r)