College aantekeningen

Statistiek 1b aantekeningen

Beoordeling

Verkocht

Pagina's

Geüpload op

05-01-2021

Geschreven in

2020/2021

Dit zijn alle aantekeningen van het vak Statistiek 1b. In dit document staat duidelijke uitleg van elk onderwerp met oefenvragen die volledig uitgewerkt zijn. Er staan veel illustraties bij om de stof beter te leren begrijpen. Dit is alle stof die je voor het tentamen moet kennen en kunnen toepassen.

Meer zien Lees minder

Instelling

Vak

Voorbeeld van de inhoud

STATISTIEK 1B AANTEKENINGEN

Statistiek 1b Aantekeningen
09-11-2020: 6.1 Week 1
Sapling voor meer oefenmateriaal. Ook uitleg over bepaalde onderwerpen.

Extra oefenopgaven op Nestor.

Assumpties voor z-procedure:

1. De variabele is een interval of ratio variabele.
2. SRSs uit de populatie(s).
3. De twee SRSs zijn onafhankelijke steekproeven.
4. Normale populatieverdeling van de scores.
5. Beide populatiestandaarddeviaties ơ1 en ơ2 zijn bekend.

Assumpties voor t-procedure:

1. De variabele is een interval of ratio variabele.
2. SRSs uit de populatie(s).
3. De twee SRSs zijn onafhankelijke steekproeven.
4. Normale populatieverdeling van de scores.

Statistische inferentie

Doel: conclusies trekken, beslissingen nemen, voorspellingen maken over een populatie op basis van
steekproefresultaten.

Twee belangrijke methodes

- Betrouwbaarheidsintervallen: het schatten van de waarde van een parameter.
- Significantietoetsen: het verkrijgen van bewijs tegen een bepaalde claim.

Er is niet één ‘correcte’ inferentiële methode, maar verschillende aanpakken:

- Frequentistische aanpak: verzekert ons dat we correcte conclusies trekken voor een vast
percentage van onderzoeken, in the long run. Tegen een bepaalde claim of hypothese.
- Bayesiaanse aanpak: kwantificeert bewijs in een bepaalde dataset voor een bepaalde
hypothese. Voor een bepaalde claim of hypothese.

De ene aanpak is handiger dan zijn dan de andere, afhankelijk wat je wil onderzoeken.
Frequentistische aanpak domineert binnen psychologie.

Betrouwbaarheidsintervallen en significantietoetsing: beide methodes op sampling distributions van
stastictics gebaseerd. Idee: wat zou er gebeuren als we deze inferentiemethode heel vaak herhalen

Voorwaarde hiervoor:

- Probability model van de date (sampling distribution)
- Betrouwbaar model >> properly randomized design

1

, STATISTIEK 1B AANTEKENINGEN

- Problematisch: voluntary response samples, confounded experiments, …

Basis sampling distributions

Centrale limietstelling:

Als n groot is, dan is de sampling distribution van het
steekproefgemiddelde x ongeveer normaal verdeel:

- Dit geldt ongeacht de vorm van de populatieverdeling.
- Voorwaarde: SRS, eindige ơ en voldoende grote n.
- Als X ~ N (µ, ơ) dan is x normaal verdeeld, ook bij kleinere n.

Aannames chapter 6

1. SRS uit de populatie waarin we geïnteresserd zijn. Geen non-response of andere praktische
problemen.
2. Normale populatieverdeling N(µ, ơ).
3. Het populatiegemiddelde µ is onbekend, maar de populatiestandaarddeviatie ơ is wel
bekend.

Deze setting is te simpel om realistisch te zijn.

Schatten met betrouwbaarheid

Het schatten van de waarde van een parameter.

Twee soorten schatters:

- Puntschatter: een enkel getal dat onze “beste gok” is voor de parameter.
- Intervalschatter: een interval van getallen dat de parameterwaarde (hopelijk) zal bevatten.

Een interval dat de meest geloofwaardige waarden van een parameter bevat.
Betrouwbaarheidsniveau (confidence level) = de kans dat deze methode een interval produceert dat
de parameter bevat.

2

, STATISTIEK 1B AANTEKENINGEN

Voorbeeld

3 is hier de puntschatter.

68-95-99,7 regel: ongeveer
kans dat 0,95 dat Ⴟ binnen 2
x 0,2 = 0,4 punten van het
populatiegemiddelde µ ligt.
Ⴟ binnen 0,4 punten van µ.

Het steekproefgemdiddelde ligt niet meer dan 0,4
van het populatiegemiddelde af, en het
populatiegemiddelde ligt dut niet meer dan 0,4 van
het steekproefgemiddelde af. Dus µ vinnen 0,4 van Ⴟ

Dus als we heel vaak een steekproef trekken en elke keer een interval Ⴟ+- 0,4 opstellen, dan zullen
we in 95% van deze intervallen µ bevatten. Ⴟ

Gedachte: wat zou er gebeuren op de lange duur, bij heel veel herhalingen?

Twee mogelijkherden voor onze ene steekrproef:

- Het interval bevat het populatiegemiddelde µ.
- Het interval bevat het populatiegemiddelde µ niet.
We weten niet of onze steekproef een van de intervallen is die bevat of niet.

We hebben dit interval verkregen met een methode die ons een correct resultaat geeft in 95% van
de gevallen.

Vanaf nu gebruiken we de normale verdeleing om exactere grenzen te gebruiken dan de vuistregel
van niet. Tabel A – stand normal distribution. Z-scoresin plaats van vuistregel.

Betrouwbaarheidsintervallen

Algemeen: C BHI (betrouwbaarheidsinterval, confidence interval) voor een parameter.

Schatter +- margin of error

Schatter = beste gok voor de parameterwaarde.

Margin of errror = indicatie van de naurwkeurighed van de schatter, gebaseerd op:

1. Variabiliteit van de schatter (via sampling distribution) en
2. Betrouwbaarheid van de methode (betrouwbaarheidsniveau C)

BHI voor een populatiegemiddelde µ

3

, STATISTIEK 1B AANTEKENINGEN

Belangrijk:

Voorbeeld

Populatie studenten:

- IQ-scores normaal verdeeld met ơ = 15

SRS van n = 10 studenten

- Gemiddelde IQ in steekproef is 117

Wat is het 80% BHI voor het populatiegemiddelde?

Gegeven X ~ N(µ, ơ = 15), n = 10, Ⴟ = 117

4

, STATISTIEK 1B AANTEKENINGEN

Gevolg: Ⴟ is normaal verdeeld, ook nu n zo klein is (CLS)

Maar waarom 90% kans ipv 80% en hoe komen we aan z* = 1,28 → MAAK EEN PLAATJE!

Je mag ook de negatieve waarde
gebruiken, dus een kans van 0,1, en
dan kom je op de -1,28 uit.

Voorbeeld

In de populatie Nederlanders zijn de scores op een geheugentests (X) rechtsscheef verdeeld met ơ =
15. In een random steekproef van 100 Nederlanders blijkt de gemiddelde score op de geheugentest
55 te zijn. Wat is het 96% BHI voor het populatiegemiddelde?

Aanname: door de grote n is steekproefgemiddelde vrijwel normaal verdeeld (CLS)

5

, STATISTIEK 1B AANTEKENINGEN

Handig is hier om een
plaatje bij te maken,
zodat je goed weet
welke p-waarde je
moet gebruiken en dus
op welke z-score je
uitkomt.

Gedrag van BHI

Gewenste eigenschappen:

- Hoge betrouwbaarheid
- Kleine margin of error

Hoe smaller het BHI, hoe nauwkeuriger de schatting van de parameter.

Welke factoren bepaalden de breedte van het BHI?

𝜎
Breedte van je interval wordt bepaalde door z*, ơ en n 𝑥̅ ± 𝑧 ∗
√𝑛
Kritieke waarde z*

- Kritieke waarde z* wordt bepaald door de keuze van het betrouwbaarheidsniveau C.
- Hoe kleiner C, hoe kleiner z*, hoe smaller het BHI.
- Dit vaak niet wat je wilt …

Populatiestandaarddeviatie ơ

- Hoe kleiner ơ, hoe smaller het BHI.
- Maar, … ơ is een kenmerk van de populatie en hier kun je (meestal) niets aan veranderen.

Steekproefgrootte n

- Hoe groter n, hoe kleiner ơ/n (kleinere variabiliteit), hoe smalle het BHI. Hier heb je wel
invloed op als onderzoeker.

Kunnen we vooraf een inschatting maken hoe groot we n moeten kiezen om een C-BHI van een
bepaalde breedte te krijgen.

➔ Breedte van BHI wordt bepaalde door margin of error m
➔ Voor de breedte van het BHI maakt het niet uit wat het steekproefgemiddelde Ⴟ wordt, dit is
slechts het midden van het interval.
Dus: margin of error moet voldoende klein zijn. Hoe? Vul de waarde in van ơ en z* en los n

∗ 𝜎 𝑧 ∗𝜎 2
op. 𝑚=𝑧  → 𝑛=( )
√𝑛 𝑚

6

, STATISTIEK 1B AANTEKENINGEN

Voorbeeld

Zoek n zodanig dat margin of error van 95% BHI voor µ gelijk wordt aan 2 als ơ = 15.

- Dus z* x ơ/n = 2
- Gegeven: z* = 1,96 en ơ = 15
- Vul alles in en los op

Je moet hierbij naar boven afronden, aangezien je betrouwbaarheidsinterval te breed wordt, en je
betrouwbaarheidsinterval is betrouwbaarder als je meer mensen hebt.

Waarschuwingen bij betrouwbaarheidsintevallen

SRS uit een populatie is nooodzakelijk.

- Formule van BHI is incorrect als we multistage random sample of stratified random sample
hebben.
- Formule van BHI werkt niet goed als je ondeugelijke data hebt.

Ⴟ is gevoelilg voor outliers.

Als steekproef klein is en populatie niet normaal, dan kan het betrouwbaarheidsinterval erg afwijken
van C.

Conclusie

C-BHI voor µ: voor een SRS van grootte n uit een populatie met onbekend gemiddelde µ en bekende
∗ 𝜎
standaarddeviatie ơ is het C BHI voor µ: 𝑥̅ ± 𝑧
√𝑛
Waarbij de z* waarde van de standaardnormale verdeling is met een oppervlakte C binnen de
kritieke punten -z* en z*.

Minimale steekproefgroottebepalen: een C BHI voor µ heeft een margin of error kleiner dan m als de
𝑧 ∗𝜎 2
steekproefgrootte groter is dan 𝑛 = ( )
𝑚

7

, STATISTIEK 1B AANTEKENINGEN

13-11-2020: 6.2
Doel van statistische inferentie: conclusies trekken, beslissingen nemen, voorspellingen maken over
een populatie op basis van een steekproef. Twee hoofdmanieren om dit te doen:

- Betrouwbaarheidsintervallen: schatten van de waarde van een parameter, wat wordt het
gemiddelde van de populatie ongeveer. Je krijgt een interval met geloofwaardige waardes.
- Significantietoetsen: verkrijgen van bewijs tegen een bepaalde claim. We hebben een
steekproef met een bepaalde hypothese die we van te voren opgesteld hebben en dan gaan
we kijken hoe goed de resultaten van de steekproef passen bij onze hypothese. We proberen
bewijs te vinden tegen de claim.

Beide technieken gebaseerd op Sampling distributions van statistics. Wat zou er gebeuren als we
deze inferentiemethode heel vaak herhalen?

Voorwaarde hiervoro:

- Probability model van de data. Die data, wat voor soort verdeling is dat, kunnen we daar een
vorm aan hangen. Een gemiddelde of standaarddeviatie aan hangen.
- Betrouwbaar model >> proporly randomized design (SRS).
- Problematisch: voluntary response samples, confounded experiments, …

Aannames in het gehele hoofdstuk 6:

1. We hebben een SRS uit de populatie waarin we geïnteresseerd zijn. Er is geen non-response
of een ander praktisch probleem.
2. De variabele die we meten heeft een exacte normale verdeling N(µ,ơ) in de populatie.
3. Het populatiegemiddelde µ is onbekend, maar we kennen de populatiestandaarddeviatie ơ
wel.
Al deze condities zijn te simpel om realistisch te zijn.

Basis Sampling Distributions

Centrale limietstelling: als n groot is, dan is de simpling random distribution van het
steekproefgemiddelde Ⴟ ongeveer normaal verdeeld. Ⴟ is ongeveer N (µ, ơ/n)

Bij elke steekproef groter
dan 1 zal de verdeling
minder scheef worden.

Standaarddeviatie = ơ/n,
dus 0,5

Antwoord C is goed.

8

Meld schending auteursrecht

Gekoppeld boek

David S. Moore, George P. Mccabe Craig, B: Introduction to the Practice of Statistics

Uitgave:december 2016
ISBN:9781319153977
Druk:9

Geschreven voor

Instelling: Rijksuniversiteit Groningen (RuG)
Studie: Psychologie
Vak: Statistiek 1b (PSBA108.20202021)

Alle documenten voor dit vak (5)

Documentinformatie

Geüpload op: 5 januari 2021
Bestand laatst geupdate op: 13 januari 2021
Aantal pagina's: 93
Geschreven in: 2020/2021
Type: College aantekeningen
Docent(en): Onbekend
Bevat: Alle colleges

Onderwerpen

statistiek
statistiek 1b
eerste jaar
psychologie
eerste jaar psychologie
bachelor psychologie
bachelor
groningen
groningen psychologie
aantekeningen
grafieken
oefenvragen
rijksuniversiteit groningen
s

$7.74

Krijg toegang tot het volledige document:

Geschreven door studenten die geslaagd zijn

Direct beschikbaar na je betaling

Online lezen of als PDF

Maak kennis met de verkoper

jlmkuipers

3.5

(24)

Ook beschikbaar in voordeelbundel

Maak kennis met de verkoper

jlmkuipers Rijksuniversiteit Groningen

Bekijk profiel

Volgen

Verkocht

165

Lid sinds

5 jaar

Aantal volgers

108

Documenten

Laatst verkocht

5 maanden geleden

3.5

24 beoordelingen

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper jlmkuipers. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor $7.74. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews) Afgelopen 30 dagen zijn er 57957 samenvattingen verkocht Opgericht in 2010, al 16 jaar dé plek om samenvattingen te kopen

Statistiek 1b aantekeningen

Voorbeeld van de inhoud

Gekoppeld boek

Geschreven voor

Documentinformatie

Onderwerpen

Ook beschikbaar in voordeelbundel

Maak kennis met de verkoper

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Niet tevreden? Kies een ander document

Betaal zoals je wilt, start meteen met leren

Bezig met je bronvermelding?

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Tevredenheidsgarantie: hoe werkt dat?

Van wie koop ik deze samenvatting?

Zit ik meteen vast aan een abonnement?

Is Stuvia te vertrouwen?