woensdag 6 september 2023 15:00
kennis verkrijgen we door
geen wetenschap: ''common sense'' • bias (verstoring): treedt op wanneer observaties beïnvloed worden door je verwachtingen
- actor bias: externe factor → het was de regen die ervoor zorgde dat ik een fout maakte in het verkeer (gedrag wordt in verband
gebracht met het weer, de tijd, een object)
- observer bias: interne factor → deze meneer is erg onbeschoft omdat hij een fout maakte in het verkeer (gedrag wordt in verband
gebracht met persoonlijkheid, aard of temperament)
- observer bias: doordat je een bepaalde verwachting hebt, komt dit naar boven in je onderzoek
wel wetenschap:
- kwalitatief (met beschrijvingen) vs. kwantitatief (met getallen)
- observatie (kijkt alleen maar) vs. experiment (groepen, controlegroepen)
- deductief (algemene situatie, maar wil iets zeggen over een specifieke situatie) vs. inductief (specifieke situatie, maar wil iets
zeggen over de gehele situatie)
wetenschappelijk onderzoek wordt uitgevoerd door middel van de empirische cirkel
waarneming: ''als ik een raaf zie is die eigenlijk altijd zwart''
inductiefase → specifieke situatie naar algemene situatie (concreet naar abstract)
onderzoekshypothese: ''alle raven zijn zwart''
deductiefase → algemene situatie naar specifieke situatie (abstract naar concreet)
voorspelling: ''van de 100 geobserveerde raven zullen er 100 zwart zijn''
toetsingsfase → met materiaal en methode
resultaten: ''10 van de 100 raven was wit''
twee correctiemechanismen
1. tijdens het publicatieproces: peer review
2. na het publicatieproces: replicatie → opnieuw doen van onderzoek • pas na flink aantal
replicaties wordt het een algemeen geaccepteerd principe
- directe replicatie: onderzoek wordt in exact dezelfde onderzoek setting gerepliceerd
- systematische replicatie: enkele aspecten uit de onderzoek setting worden veranderd
- conceptuele replicatie: dezelfde onderzoeksvraag maar in een geheel nieuwe setting
methoden van onderzoek en statistiek Pagina 1
,dt1 steekproeven
maandag 11 september 2023 09:00
populatieparameter
we willen vaak een uitspraak doen over een eigenschap in een populatie, maar:
→ populatie = de gehele groep waarover je uitspraken wil doen, maar dit is vaak een (bijna)
oneindig aantal proefobjecten waarin je geïnteresseerd bent
(populatie)parameter = een waarde die iets zegt over een populatie/een populatie
beschrijft, maar het meten van de hele populatie is niet te doen
bijvoorbeeld mate van zelfbewustzijn in alle Aziatische olifant door hoeveelheid aanrakingen
hoofd in spiegel per minuut
we kunnen hiervan een populatieverdeling opstellen, door middel van een kansverdeling
(probability distribution): een schatting van de normaalverdeling , dus wat we denken te
kunnen zeggen over de gehele populatie
we willen uitspraak doen over de populatieparameter van dit onderwerp, maar alle olifanten
testen gaat wat ver dus oplossing:
- schatten van de populatieparameter met een representatieve steekproef (sample).
maar, wat kan hier fout gaan:
○ niet representatieve steekproef, bijvoorbeeld: je wil iets weten over alle uva
studenten, dus je gaat de psychobiologie studenten interviewen
○ nuance van conclusie: olifanten in een dierentuin gedragen zich anders dan
olifanten in het wild (maar dat is makkelijker testen)
na het uitvoeren van een steekproef kunnen we een steekproefverdeling (sample
distribution) opstellen, door middel van een frequentieverdeling (frequency distribution):
een normaalverdeling op basis van echte gegevens uit de steekproef
type fouten in steekproef
gele middelpunt = de populatieparameter
1. steekproeffluctiaties (sampling error): heeft effect op zuiverheid/betrouwbaarheid (precision) van
de steekproefschatting
toevallig verschil (door het kansproces) door omgevingsfactoren die je niet in de hand hebt, waardoor
de standaarddeviatie wordt beïnvloed. in de psychobiologie komt dit eigenlijk altijd voor want er wordt
altijd gewerkt met proefpersonen/-dieren.
→ bijvoorbeeld: proefpersoon die niet helemaal lekker is (slecht geslapen, ruzie gehad).
→ gevolg: uiteenlopende resultaten
2. sampling bias: heeft effect op doeltreffendheid/validiteit (accuracy)
systematisch verschil dat alleen gebeurt alleen bij een niet-representatieve steekproef. niet de
standaarddeviatie, maar het gemiddelde wijkt af (van het werkelijke gemiddelde).
→ gevolg: resultaten die niet accuraat zijn
ook de grootte van het onderzoek (sample size) speelt een grote rol
- kleinere steekproef is vaak imprecize (en heeft dus een grotere sampling error)
- een grotere steekproef creëert meer zekerheid
sample of convenience: een steekproef uit de populatie die voor de hand ligt (makkelijk is), waardoor
minder valide
→ bijvoorbeeld: die olifanten in de dierentuin, in plaats van in het wild onderzoeken
steekproevenverdeling (sampling distribution)
dus tot nu toe hebben we behandeld:
- in de wetenschap willen we uitspraken doen over een populatie (generaliseren)
○ hiervan kunnen we een populatieverdeling opzetten, door middel van een kansverdeling
- vervolgens kunnen we een steekproef uitvoeren en een steekproefverdeling opzetten door het verwerken van de gevonden
waarden in een frequentieverdeling
- doordat we niet de hele populatie hebben onderzocht, zijn de conclusies onzeker
○ er is namelijk (kans op) sampling error en bias
- en dan nu: met de steekproevenverdeling kwantificeren we de onzekerheid en toetsen we de hypothese
steekproevenverdeling (sampling distribution): theoretische kansverdeling
methoden van onderzoek en statistiek Pagina 2
, steekproevenverdeling (sampling distribution): theoretische kansverdeling
gebaseerd op het gemiddelde en de standaardfout van een steekproef die gebruikt
wordt om hypotheses te testen
→ de steekproevenverdeling is essentieel om een hypothese op te stellen
net als populatieverdeling theoretische kansverdeling: we kunnen dit nooit echt
meten (zit in ons hoofd), gebaseerd op gemiddelde en standaardfout van een
steekproef (hoezo is dit niet te meten???)
ook een theoretische kansverdeling.
→ steekproefverdeling is de verdeling van de waarden die je uit een steekproef trekt
→ steekproevenverdeling is de verdeling van de meerdere steekproeven
- heel betrouwbaar want hele grote steekproef, waardoor de histrogram steeds
smaller wordt naarmate er meer steekproeven worden uitgevoerd
- hoe groter de steekproef hoe kleiner de onzekerheid
- de spreiding van de steekproevenverdeling drukken we uit in de
standaardfout (standaarddeviatie van je steekproeven)
standaardfout = (standaarddeviatie) / (aantal proefobjecten)
inferentiële uitspraken
wat kunnen we nu zeggen over de opgestelde hypothese?
→ wanneer kun je generaliseren naar de populatie?
op basis van de steekproef kun je de betrouwbaarheidsinterval (confidence interval) bepalen
→ betrouwbaarheidsinterval = 2x standaardfout naar links en 2x naar rechts
- in het grote gebied heb je 95% van alle waarden die je kan verwachten, met links en
rechts segmentje van 2.5
- werkelijk gemiddelde zit dus met 95% kans binnen het betrouwbaarheidsinterval (maar,
werkelijk gemiddelde kan dus alsnog in de 5% zitten)
- 100% betrouwbaarheidsinterval bestaat niet
dus, met het voorbeeld van de olifanten
de volgende waarden (aanrakingen per minuut) zijn gevonden van de
- Aziatische olifant [11, 14, 16, 18]
- Afrikaanse olifant [7, 9, 10, 13]
geeft gemiddelde (aanrakingen per minuut)
- Aziatische olifant [14.75]
- Afrikaanse olifant [9.75]
geschatte standaarddeviatie
- Aziatische olifant [3.0]
- Afrikaanse olifant [2.5]
standaardfout (SE) in de formule geeft
- Aziatische olifant (3.0) / (√4) = 1.5
- Afrikaanse olifant (2.5) / (√4) = 1.25
deze gegevens zetten we in een staafdiagram.
- de gekleurde balken lopen op tot het gemiddelde (de piek van de kansverdeling)
- de zwarte lijn geeft het betrouwbaarheidsinterval aan, namelijk 2x de standaardfout:
○ dus voor Aziatische olifant 1.5x2=3
○ dus voor Afrikaanse olifant 1.25x2=2.5 naar boven en beneden
- je hebt dan dus de kans van 95% dat je gemiddelde uitkomt ergens binnen deze zwarte lijnen
- dit betekent dat je voor zowel de Aziatische als de Afrikaanse olifant 97.5% kans hebt om onder hun eigen onderste lijn te ko men
- de gemiddeldes van de twee olifanten vallen dus niet in elkaars betrouwbaarheidsinterval, dus je kan met 95% zekerheid zeggen dat de
populatiegemiddelden van elkaar verschillen (dus, de een is slimmer dan de ander)
conclusie
op basis van de steekproef kun je dus zeggen dat Aziatische
olifanten meer zelfbewustheid hebben dan Afrikaanse olifanten
→ omdat het heel waarschijnlijk is dat de populatiegemiddeldes
verschillen (dus: Aziatische olifanten raken zichzelf in de spiegel
''altijd'' vaker aan dan dat Afrikaanse olifanten dat doen)
methoden van onderzoek en statistiek Pagina 3
,conclusie
op basis van de steekproef kun je dus zeggen dat Aziatische
olifanten meer zelfbewustheid hebben dan Afrikaanse olifanten
→ omdat het heel waarschijnlijk is dat de populatiegemiddeldes
verschillen (dus: Aziatische olifanten raken zichzelf in de spiegel
''altijd'' vaker aan dan dat Afrikaanse olifanten dat doen)
methoden van onderzoek en statistiek Pagina 4
,dt2 chi-kwadraattoets
maandag 25 september 2023 16:53
college 4 hypothesetoetsen en proporties
hypothesetoets
stelling: verhouding mannelijke en vrouwelijke duiven op de Dam is 50 -50
uitkomst:
45 mannetjes dus P(duif=mannetje)=0.45
55 vrouwtjes dus P(duif=vrouwtje)=0.55
stap 0. assumpties checken
wanneer kun je zeggen dat verhouding dan NIET 50 -50 is?
→ met de hypothesetoets kun je zeggen of er genoeg evidentie is assumpties: aannames over en verzamelen van data.
centrale limiet stelling: ook al is je populatie niet normaal verdeeld,
deze bestaat uit 5 stappen: als je genoeg steekproeven neemt, dan benadert de
0. assumpties checken steekproevenverdeling uiteindelijk een normaalverdeling.
1. hypothese opstellen → random steekproef: elk lid van de populatie moet evenveel kans
2. toetsingsgrootheid berekenen hebben om in de steekproef opgenomen te worden
3. P-waarde bepalen → bij iedere observatie is de kans hetzelfde
4. conclusie trekken
1. hypothese opstellen 2. toetsingsgrootheid berekenen
we denken dat er meer vrouwelijke dan mannelijke duiven zijn op de dam toetsingsgrootheid is het getal dat uit het experiment komt
→ hoe goed komen dit getal en H0 overeen? (dus p
H0 hypothese: ''mannelijke en vrouwelijke duiven zijn even frequent aanwezig'' vergelijken met p0)
aka ''de proportie mannelijke duiven op de Dam is 0.5''
→ dus H0: p=p0=0.5
→ nulhypothese is altijd specifiek a=b of proportie=5
HA hypothese: ''mannelijke en vrouwelijke duiven zijn niet even frequent aanwezig''
aka ''de proportie mannelijke duiven op de Dam is niet 0.5''
→ dus: HA: p≠0.5
→ alternatieve hypothese zegt niet gelijk aan nulhypothese (oneindige
mogelijkheden)
onderzoekshypothese = alternatieve hypothese ≠ nulhypothese
3. P-waarde bepalen
P-waarde: kans op de observatie als nulhypothese waar zou zijn
4. conclusie trekken
is het verschil tussen 0.45 en 0.5 groot genoeg om met zekerheid te zeggen dat de → als we de nulhypothese niet kunnen verwerpen kun je
nulhypothese moet verwerpen? geen inhoudelijke conclusie trekken
→ gebruik van formule om zelf uit te rekenen → als we de nulhypothese wel kunnen verwerpen, dan mag
→ voor dit onderzoek veel te veel mogelijkheden, dus R je de alternatieve hypothese aannemen
- pbinom(45,100,0.5) geeft p=0.18
- p waarde veel groter dan 0.05, dus we verwerpen H0 niet
- geen evidentie dat proportie van mannelijke en vrouwelijke duiven op de Dam
verschillend is, maar je kan dus niet zeggen dat ze niet gelijk zijn aan elkaar
- je kan de nulhypothese dus nooit aannemen
fouten maken
binominaalverdeling
verwerp H0 niet verwerp H0
experiment over telepathie d.m.v. 5 figuurtjes
H0 is waar correct type l fout
hypothesen H0 is niet waar type ll fout correct
H0: de kans op succes 0.20 (want dit is de kans dat je random het goede figuurtje
aanklikt)
dus:
HA: de kans op succes is groter dan 0.20 (want dan zou de proefpersoon het echt
- type l fout (false positive): het verwerpen van H 0 terwijl deze waar is
weten)
- type ll fout (false negative): het niet verwerpen van H 0 terwijl deze niet waar is
uitkomst: goed/fout (binominaal)
blauw: als de geobserveerde waarde boven (rechts van) de kritieke waarde van p=0.05 zit, dan
kans op goed: 0.20
is er sprake van type l fout
n=4 trials met p=0.20
mogelijke uitkomsten: 16 (GGGG, GGGF, GGFG,…)
rood: type ll fout
kans op GGGG: (0.20) 4
kans op GGGF: (0.20) 3 • 0.80
hoe groter de steekproef, hoe groter de power
(we zijn op zoek naar proportie, dus de kans op GGFG is even groot) - want hoe groter de steekproef, hoe kleiner de onzekerheid, hoe groter de power
methoden van onderzoek en statistiek Pagina 5
, → afhankelijke variabele (gevolg) categorisch numeriek
↓ onafhankelijke variabele (oorzaak)
geen vergelijking (2 opties) binominaaltoets
chi-kwadraat toets voor modelpassing
categorisch chi-kwadraat toets voor onafhankelijkheid
numeriek
chi-kwadraat toets H0: de yogastudio's zijn random over Amsterdam verspreid
- poissonverdeling: verdeling die je krijgt als dingen compleet random
twee situaties: zijn verspreid
- dus: als we deze verdeling terugzien kunnen we de nulhypothese niet
1. modelpassing met 1 variabele verwerpen
- zijn er meer yogastudio's locaties in gebieden in Amsterdam
- systematiek vs. random
→ 'successen' zijn in dit geval yogastudio's
- voor de verwachting heb je een kansmodel nodig
- welke kans zou je toekennen aan ieder hokje?
op basis van deze informatie construeren van de poissonverdeling
→ uitrekenen van het gemiddelde gemiddelde berekenen
→ besluiten van hoeveel studio's je welke kans wil berekenen met dpois
vervolgens heb je dus een frequentie en een kans, maar kun je niet met elkaar
vergelijken
→ dus theoretische kans omzetten naar frequenties door te vermenigvuldigen
met totaal aantal hokjes
chi-kwadraattoets met als uitkomst de toetsgrootheid
deze kan vergeleken worden met wat we daadwerkelijk geobserveerd hebben,
met een alpha van 0.05
kritieke waarde bepalen
df=(aantal categorieën)-1-(aantal parameters geschat)
df=10-1-1(gemiddelde)=8 vrijheidsgraden
x2=4.24
alpha=0.05
df=8 1.
kritieke grens opzoeken op p.714 geeft waarde van 15.51
4.24 is veel kleiner dan 15.51 dus je overschrijdt de kritieke waarde niet, dus je
kan de nulhypothese niet verwerpen
exacte p waarde berekenen met pchisq geeft 0.83, veel groter dan 0.05
als de verwachte frequentie 0 is gaat het verkeerd want hier kun je niet mee
delen, dus dan moet je categorieën samendelen
2. chi-kwadraattoets voor onafhankelijkheid (is er een associatie tussen twee variabelen
- associatie tussen MDD en GAD, aandoeningen met zelfde symptomen
- kans om gediagnostiseerd te worden met het verkeerde (onafhankelijk)
in de tabel staan geobserveerde frequenties, en dit wordt vergeleken met wat je verwacht
Pr[GAD] = 37/91 = 0.407
Pr[D] = 42/91 = 0.462
verwachte Pr[GAD en D]= 0.407 * 0.462 = 0.188
dus verwachte frequentie = 0.188 * 91 = 17.1
geobserveerde Pr[GAD en D] = 24/91 = 0.264
vervolgens kan de chi-kwadraat worden berekend met de formule
x2=8.32
alpha=
df=(aantal rijen - 1) * (aantal kolommen - 1) = (2-1)(2-1) = 1
kritieke waarde opzoeken in tabel = 3.84
pchisq geeft 0.004 dus kleiner dan 0.05 dus je kan de nulhypothese verwerpem
oefentoets sowiso
juist:
I: De nulhypothese van de χ2 contingency test (chi-kwadraat-toets) is dat twee of meer
categorische variabelen onafhankelijk van elkaar zijn.
II: De verwachte celfrequenties (expected frequencies) van de χ2 contingency test (chi -
kwadraat-toets) is gebaseerd op de multiplication rule uit de kansrekening: Pr(A en B)=Pr(A)
Pr(B)
methoden van onderzoek en statistiek Pagina 6