Statistiek
Voorbereiding hoorcollege 1 (H1 & 2):
Beschrijvende (scriptieve) statistiek-> Gegevens van een grote groep
mensen met individuele scores samenvatten. Bijvoorbeeld in een tabel of
grafiek.
Inferentiele statistiek-> statistiek om onderzoeksvraag en hypothese te
beantwoorden. Samples bestuderen en terugbrengen naar de hele
populatie. Patronen die je ziet in steekproeven, generaliseren naar de
bredere populaties.
Gebruikt steekproefgegevens om algemene conclusies te trekken over
populaties.
Variabele: iets dat kan variëren, verschillende waarden. Bijvoorbeeld
verschillende oogkleuren.
Data: collectie van scores op variabelen.
Populatie: hele groep die je wilt onderzoeken.
Sample: een deel van de groep die je wilt onderzoeken.
2 belangrijke waardes:
- Parameter= waarde die een samenvatting geeft van de populatie.
Bijvoorbeeld het percentage adolescenten in de populatie, de meest
voorkomende naam etc.
- Statistieken= steekproef broertjes van de parameter. Je kan niet
heel de populatie meten, dus je pakt een deel van de populatie. Dit
zijn steekproeven en zal nooit 100% hetzelfde zijn als de
parameter= sampling error.
Statistieken generaliseren naar parameters-> doen in de context van 2
soorten onderzoeksvragen.
1. Vragen over gemiddelden of verschillen in gemiddelden.
Bijvoorbeeld: is het populatiegemiddelde gelijk aan tien of is het
gemiddelde in Leiden hoger dan in Amsterdam?
2. Vragen over relaties tussen variabelen. Bijvoorbeeld: leidt meer
oefening tot betere prestaties?
Geïnteresseerd in hypothetische constructen-> dingen die je niet kunt
zien, zoals extravert. Nuttig zijn voor het verklaren van gedrag. Deze
constructen worden ook wel hypothetische constructen genoemd.
Stappen van operationaliseren (omzetten naar nummers):
1. Wat is de structuur? Heb je veel categorieën (continu verschil), of
kan je het in 2 groepen verdelen (categorisch verschil)?
2. Wat is de kern en hoe komt het tot uiting in menselijk gedrag?
3. Hoe kunnen we a an het gedrag een waarde toekennen?
, 4. Let op! De operationalisaties zijn nooit het construct zelf. De vraag
(operationalisatie) is de intelligentie en het
construct/meeting/stappen is een IQ-test. De scores op de test zijn
niet hetzelfde als hun intelligentie. Het staat alleen misschien in
verband met elkaar.
Operationele definitie
We kunnen het gedrag van intelligentie bijvoorbeeld niet zien, maar we
kunnen wel voorbeelden zien van intelligent gedrag (extern gedrag). Een
operationele definitie legt uit hoe je iets meet door naar zichtbaar gedrag
te kijken en dat als maat te gebruiken. Meten en uitleggen:
○ Ten eerste beschrijft het een set operaties voor het meten van een
construct
○ Ten tweede definieert het het construct in termen van resulterende
metingen
Je intelligentie wordt bijvoorbeeld gemeten en bepaald door je prestaties
op een IQ-test of honger kan gemeten en gedefinieerd worden door het
aantal uren sinds je laatste maaltijd.
Om depressie te meten kan je bijvoorbeeld vragen om mensen een
formulier in te laten vullen met de vraag of ze graag onder de mensen zijn
op een schaal van 0-10.
Meerdere operationalisaties doen, zodat er meer data zijn en je patronen
kunt ontdekken.
Correlational method= 2 verschillende variabelen worden onderzocht
binnen 1 groep en gekeken of er een verband is tussen de 2. Bijvoorbeeld
prestatie schoolresultaten en de bedtijd van studenten.
De experimentele methode= één variabele wordt gemanipuleerd,
terwijl een andere variabele wordt waargenomen en gemeten om een
oorzaak-gevolg relatie tussen de twee variabelen vast te stellen. Hierdoor
krijg je 2 groepen die onderzocht worden voor 1 resultaat. Een experiment
probeert alle andere variabelen te beheersen om te voorkomen dat deze
de resultaten beïnvloeden.
Manipulatie
De onderzoeker manipuleert een variabele door de waarde te veranderen
van het ene niveau naar het andere niveau. Bijvoorbeeld films met en
zonder geweld.
De onafhankelijke variabele
De onafhankelijke variabele is de variabele die door de
onderzoeker wordt gemanipuleerd. In gedragsonderzoek bestaat
de onafhankelijke variabele meestal uit de twee of meer
treatment condities waaraan proefpersonen worden blootgesteld.
De manipulatie van de onafhankelijke variabele vindt plaats
voordat de afhankelijke variabele wordt gemeten. Dus
bijvoorbeeld de mate van scheldwoorden.
De afhankelijke variabele
De afhankelijke variabele wat wordt waargenomen om de
effecten van de behandelingen/manipulatie vast te stellen. Dus
bijvoorbeeld de hoeveelheid pijn die gevoeld wordt.
,Niet experimentele methode
Zie samenvatting voor meer uitleg.
Variabelen onderverdelen in verschillende categorieën:
Nominaal (hele getallen): verschillen op zo’n score geven kwalitatieve
verschillen tussen mensen aan. Geen kwantitatieve interpretatie.
Bijvoorbeeld: verschillende haarkleuren zijn te meten, maar je kan niet
zeggen dat de ene beter is dan de ander.
Ordinaal (hele getallen): verschillen op zo’n score geven kwalitatieve
verschillen tussen mensen aan. Er is een bepaalde ordening. Hogere
scores geven aan dat iemand ook meer heeft van iets. Wel ordening, maar
geen informatie over afstand tussen categorieën.
Bijvoorbeeld een sociaaleconomische status, maar wat nou precies het
verschil is tussen laag en hoog weten we niet. Hierover krijg je geen
informatie.
Interval (alle getallen): verschillen op zo’n score geven kwalitatieve
verschillen tussen mensen aan. Er is een bepaalde ordening. Hogere
scores geven aan dat iemand ook meer heeft van iets. Hier kunnen we iets
zeggen over de afstand tussen scores, maar niet over de verhouding. Je
kunt zeggen dat tussen 5 en 20, 15 zit. Maar je kan niet zeggen dat 50 het
dubbele van 25 is, omdat er geen natuurlijke 0 is, waarbij het variabele er
niet is. Je weet dus niet waar het beginpunt is. Een negatieve variabele is
wel mogelijk. Bijvoorbeeld temperatuur. Of het verschil in lengte: 2 is 2cm
groter dan 1-> nummer +2. 3 is 4 cm kleiner dan 1-> -4. Het getal 0 is
hier geen natuurlijk 0 punt meer, maar komt overeen met de gemiddelde
lengte.
Ratio (alle getallen): verschillen op zo’n score geven kwalitatieve
verschillen tussen mensen aan.
Er is een bepaalde ordening. Hogere scores geven aan dat iemand ook
meer heeft van iets. Hier kunnen we iets zeggen over de afstand tussen
scores. Tussen 5 en 20 zit 15. Deze getallen hebben een natuurlijk 0 punt,
dus kan je zeggen dat 50 het dubbele is van 25. Een negatieve variabele is
niet mogelijk. Bijvoorbeeld lengte. Dit kan niet bestaan en kan niet
negatief zijn.
Frequency Distributions/verdelingen -> tabel
Beschrijft hoe waarden van een dataset of populatie zijn verdeeld.
X= score= variabele, bijvoorbeeld leeftijd (10, 11, 12, 13, 14, etc.) Van
hoog naar laag weergegeven in de tabel.
, Y= frequentie= hoe vaak iets voor komt (leeftijd van 10 komt 5x voor, 11
komt 2x voor, 12 komt 6x voor etc.) Dit is de totale groep waar je een test
mee doet.
Let op! Onderaan komt het laagste getal en bovenaan het hoogste!!
Voorbeeld:
Variabele= aantal paar schoenen.
Kans/proportie
De relatieve frequentie van de uitkomst. Verhouding van score tot het
totaal.
- Hoe vaak de uitkomst voorkomt in verhouding tot het aantal observaties
- Proportie = p = f / N = frequentie / totale aantal
N= Σf
Hoeveel scores er in een set zijn/van hoeveel mensen iets is gemeten.
N= voor de populatie
n= voor een sample
10, 6, 7, 4-> ΣX = 27
Σ(X – 1)2
Eerst voor alle x (X-1)2 uitrekenen en dit dan allemaal bij elkaar optellen.
ΣX – 1
Eerst alles van x bij elkaar optellen en dan 1 eraf halen! Er staan geen
haakjes, dus werk je van links naar rechts.
ΣXY
Eerst de X vermenigvuldigen met Y en dit dan bij elkaar optellen.
Voor een grotere tabel met meer frequenties:
Voor ΣX, eerst de frequenties uitrekenen en dit dan bij elkaar optellen.
Voor ΣX2 eerst de X in het kwadraad doen en dan vermenigvuldigen met
de frequenties.
Voorbereiding hoorcollege 1 (H1 & 2):
Beschrijvende (scriptieve) statistiek-> Gegevens van een grote groep
mensen met individuele scores samenvatten. Bijvoorbeeld in een tabel of
grafiek.
Inferentiele statistiek-> statistiek om onderzoeksvraag en hypothese te
beantwoorden. Samples bestuderen en terugbrengen naar de hele
populatie. Patronen die je ziet in steekproeven, generaliseren naar de
bredere populaties.
Gebruikt steekproefgegevens om algemene conclusies te trekken over
populaties.
Variabele: iets dat kan variëren, verschillende waarden. Bijvoorbeeld
verschillende oogkleuren.
Data: collectie van scores op variabelen.
Populatie: hele groep die je wilt onderzoeken.
Sample: een deel van de groep die je wilt onderzoeken.
2 belangrijke waardes:
- Parameter= waarde die een samenvatting geeft van de populatie.
Bijvoorbeeld het percentage adolescenten in de populatie, de meest
voorkomende naam etc.
- Statistieken= steekproef broertjes van de parameter. Je kan niet
heel de populatie meten, dus je pakt een deel van de populatie. Dit
zijn steekproeven en zal nooit 100% hetzelfde zijn als de
parameter= sampling error.
Statistieken generaliseren naar parameters-> doen in de context van 2
soorten onderzoeksvragen.
1. Vragen over gemiddelden of verschillen in gemiddelden.
Bijvoorbeeld: is het populatiegemiddelde gelijk aan tien of is het
gemiddelde in Leiden hoger dan in Amsterdam?
2. Vragen over relaties tussen variabelen. Bijvoorbeeld: leidt meer
oefening tot betere prestaties?
Geïnteresseerd in hypothetische constructen-> dingen die je niet kunt
zien, zoals extravert. Nuttig zijn voor het verklaren van gedrag. Deze
constructen worden ook wel hypothetische constructen genoemd.
Stappen van operationaliseren (omzetten naar nummers):
1. Wat is de structuur? Heb je veel categorieën (continu verschil), of
kan je het in 2 groepen verdelen (categorisch verschil)?
2. Wat is de kern en hoe komt het tot uiting in menselijk gedrag?
3. Hoe kunnen we a an het gedrag een waarde toekennen?
, 4. Let op! De operationalisaties zijn nooit het construct zelf. De vraag
(operationalisatie) is de intelligentie en het
construct/meeting/stappen is een IQ-test. De scores op de test zijn
niet hetzelfde als hun intelligentie. Het staat alleen misschien in
verband met elkaar.
Operationele definitie
We kunnen het gedrag van intelligentie bijvoorbeeld niet zien, maar we
kunnen wel voorbeelden zien van intelligent gedrag (extern gedrag). Een
operationele definitie legt uit hoe je iets meet door naar zichtbaar gedrag
te kijken en dat als maat te gebruiken. Meten en uitleggen:
○ Ten eerste beschrijft het een set operaties voor het meten van een
construct
○ Ten tweede definieert het het construct in termen van resulterende
metingen
Je intelligentie wordt bijvoorbeeld gemeten en bepaald door je prestaties
op een IQ-test of honger kan gemeten en gedefinieerd worden door het
aantal uren sinds je laatste maaltijd.
Om depressie te meten kan je bijvoorbeeld vragen om mensen een
formulier in te laten vullen met de vraag of ze graag onder de mensen zijn
op een schaal van 0-10.
Meerdere operationalisaties doen, zodat er meer data zijn en je patronen
kunt ontdekken.
Correlational method= 2 verschillende variabelen worden onderzocht
binnen 1 groep en gekeken of er een verband is tussen de 2. Bijvoorbeeld
prestatie schoolresultaten en de bedtijd van studenten.
De experimentele methode= één variabele wordt gemanipuleerd,
terwijl een andere variabele wordt waargenomen en gemeten om een
oorzaak-gevolg relatie tussen de twee variabelen vast te stellen. Hierdoor
krijg je 2 groepen die onderzocht worden voor 1 resultaat. Een experiment
probeert alle andere variabelen te beheersen om te voorkomen dat deze
de resultaten beïnvloeden.
Manipulatie
De onderzoeker manipuleert een variabele door de waarde te veranderen
van het ene niveau naar het andere niveau. Bijvoorbeeld films met en
zonder geweld.
De onafhankelijke variabele
De onafhankelijke variabele is de variabele die door de
onderzoeker wordt gemanipuleerd. In gedragsonderzoek bestaat
de onafhankelijke variabele meestal uit de twee of meer
treatment condities waaraan proefpersonen worden blootgesteld.
De manipulatie van de onafhankelijke variabele vindt plaats
voordat de afhankelijke variabele wordt gemeten. Dus
bijvoorbeeld de mate van scheldwoorden.
De afhankelijke variabele
De afhankelijke variabele wat wordt waargenomen om de
effecten van de behandelingen/manipulatie vast te stellen. Dus
bijvoorbeeld de hoeveelheid pijn die gevoeld wordt.
,Niet experimentele methode
Zie samenvatting voor meer uitleg.
Variabelen onderverdelen in verschillende categorieën:
Nominaal (hele getallen): verschillen op zo’n score geven kwalitatieve
verschillen tussen mensen aan. Geen kwantitatieve interpretatie.
Bijvoorbeeld: verschillende haarkleuren zijn te meten, maar je kan niet
zeggen dat de ene beter is dan de ander.
Ordinaal (hele getallen): verschillen op zo’n score geven kwalitatieve
verschillen tussen mensen aan. Er is een bepaalde ordening. Hogere
scores geven aan dat iemand ook meer heeft van iets. Wel ordening, maar
geen informatie over afstand tussen categorieën.
Bijvoorbeeld een sociaaleconomische status, maar wat nou precies het
verschil is tussen laag en hoog weten we niet. Hierover krijg je geen
informatie.
Interval (alle getallen): verschillen op zo’n score geven kwalitatieve
verschillen tussen mensen aan. Er is een bepaalde ordening. Hogere
scores geven aan dat iemand ook meer heeft van iets. Hier kunnen we iets
zeggen over de afstand tussen scores, maar niet over de verhouding. Je
kunt zeggen dat tussen 5 en 20, 15 zit. Maar je kan niet zeggen dat 50 het
dubbele van 25 is, omdat er geen natuurlijke 0 is, waarbij het variabele er
niet is. Je weet dus niet waar het beginpunt is. Een negatieve variabele is
wel mogelijk. Bijvoorbeeld temperatuur. Of het verschil in lengte: 2 is 2cm
groter dan 1-> nummer +2. 3 is 4 cm kleiner dan 1-> -4. Het getal 0 is
hier geen natuurlijk 0 punt meer, maar komt overeen met de gemiddelde
lengte.
Ratio (alle getallen): verschillen op zo’n score geven kwalitatieve
verschillen tussen mensen aan.
Er is een bepaalde ordening. Hogere scores geven aan dat iemand ook
meer heeft van iets. Hier kunnen we iets zeggen over de afstand tussen
scores. Tussen 5 en 20 zit 15. Deze getallen hebben een natuurlijk 0 punt,
dus kan je zeggen dat 50 het dubbele is van 25. Een negatieve variabele is
niet mogelijk. Bijvoorbeeld lengte. Dit kan niet bestaan en kan niet
negatief zijn.
Frequency Distributions/verdelingen -> tabel
Beschrijft hoe waarden van een dataset of populatie zijn verdeeld.
X= score= variabele, bijvoorbeeld leeftijd (10, 11, 12, 13, 14, etc.) Van
hoog naar laag weergegeven in de tabel.
, Y= frequentie= hoe vaak iets voor komt (leeftijd van 10 komt 5x voor, 11
komt 2x voor, 12 komt 6x voor etc.) Dit is de totale groep waar je een test
mee doet.
Let op! Onderaan komt het laagste getal en bovenaan het hoogste!!
Voorbeeld:
Variabele= aantal paar schoenen.
Kans/proportie
De relatieve frequentie van de uitkomst. Verhouding van score tot het
totaal.
- Hoe vaak de uitkomst voorkomt in verhouding tot het aantal observaties
- Proportie = p = f / N = frequentie / totale aantal
N= Σf
Hoeveel scores er in een set zijn/van hoeveel mensen iets is gemeten.
N= voor de populatie
n= voor een sample
10, 6, 7, 4-> ΣX = 27
Σ(X – 1)2
Eerst voor alle x (X-1)2 uitrekenen en dit dan allemaal bij elkaar optellen.
ΣX – 1
Eerst alles van x bij elkaar optellen en dan 1 eraf halen! Er staan geen
haakjes, dus werk je van links naar rechts.
ΣXY
Eerst de X vermenigvuldigen met Y en dit dan bij elkaar optellen.
Voor een grotere tabel met meer frequenties:
Voor ΣX, eerst de frequenties uitrekenen en dit dan bij elkaar optellen.
Voor ΣX2 eerst de X in het kwadraad doen en dan vermenigvuldigen met
de frequenties.