Geschreven door studenten die geslaagd zijn Direct beschikbaar na je betaling Online lezen of als PDF Verkeerd document? Gratis ruilen 4,6 TrustPilot
logo-home
Samenvatting

Samenvatting Colleges Statistiek 2: Verklaren en Voorspellen

Beoordeling
-
Verkocht
2
Pagina's
50
Geüpload op
03-10-2018
Geschreven in
2017/2018

alle colleges van het blok statistiek 2: Verklaren en voorspellen samengevat in 1 document. Inclusief uitgewerkte voorbeelden en uitleg.

Voorbeeld van de inhoud

College 1
Herhaling blok 1.3
Meetniveaus:
1. Nominaal → onderdelen in groepen, categorieën (niet meer of beter, appel en peer)
2. Ordinaal → logische ordening aan te brengen in de groepen (bv. SES, laag/midden/hoog),
maar de verschillen tussen de groepen zijn niet even hoog
3. Interval → logische ordening, afstanden tussen de categorieën zijn even groot (8→10→12 of
graden Celsius, kan onder 0)
4. Ratio → logische ordening, afstanden tussen categorieën zijn even groot én er is een absoluut
nulpunt (gewicht, lengte, snelheid, inkomen; kan niet negatief worden)→iets van 0 is helemaal
geen lengte

Als iets een vaststaand nulpunt heeft, kan je zeggen dat iets 2x zo groot is als iets anders

Voorbeeld temperatuur (interval); je kan zeggen dat 10 naar 12 graden evenveel scheelt als 20 naar 22
graden, maar je kan niet zeggen dat 20 graden twee keer zo veel is als 10 graden. (die uitspraken kan
je alleen doen met een absoluut nulpunt, dus met ratio)

Frequentieverdeling:
- Symmetrisch
- Scheef naar links
- Scheef naar rechts
Denk aan naaldhakken: waar wijst de neus naartoe.

Centrummaten:
• Modus: meest voorkomende score
• Mediaan: middelste score, evenveel mensen onder als boven
• Mean/Gemiddelde: de som van alle scores gedeeld door het aantal
∑𝑛
𝑖=1 𝑥𝑖
𝑥̅ = 𝑛
je telt de scores op en deelt het door het aantal mensen in je steekproef.

Spreidingsmaten:
Spreiding: zitten de waarden van een variabele dichtbij elkaar of ver van elkaar af?
Standaarddeviatie: gemiddelde spreiding rond het gemiddelde
➔ Waarom doe je de SD in het kwadraat?
Als je alle afwijkingen van het gemiddelde optelt, dan kom je anders op 0 uit. (+ en – valt
tegen elkaar weg)
➔ Waarom doe je n-1?
Je wil niet dat je variatie afhangt van hoe groot je steekproef is. (niet: hoe meer mensen, hoe
groter het getal)
∑𝑁
𝑖=1(𝑥𝑖 −𝑥̅ )
2 𝑠𝑢𝑚 𝑜𝑓 𝑠𝑞𝑢𝑎𝑟𝑒𝑠 𝑆𝑆
𝑣𝑎𝑟𝑖𝑎𝑛𝑡𝑖𝑒 = 𝑠 2 = 𝑁=1
= 𝑁−1
= 𝑁−1
𝑆𝐷 = √𝑠 2 = 𝑠

Standaardscores (Z-scores)
Z-score: het aantal SD’s dat een score X verwijderd is van het gemiddelde
Het maakt niet uit welke data we hebben, we kunnen ze terugvertalen naar de
standaardnormaalverdeling, dan kun je de tabel in het boek gebruiken om te kijken of de score
zeldzaam of extreem is. →is iets wat we vinden wel/niet opmerkelijk?
(𝑥−𝑥̅ )
𝑧 − 𝑠𝑐𝑜𝑟𝑒 = 𝑧 = 𝑆𝐷

De normale verdeling
Normaalverdeling: als je weet hoeveel standaarddeviaties iets hoger is, kan je de percentages erbij
berekenen. Je kan precies bepalen of iets wel of niet extreem is.

,Voorbeeld hierbij
IQ-scores zijn normaal verdeeld met een gemiddelde van 100 en een standaarddeviatie van 15. Welk
percentage heeft een IQ-score tussen de 85 en 115?
P(X>85 en X<115)
= 1-P(X<85 en X>115)

Z(X=85) → (85-100)/15 = -1
Z(X=115)→(115-100)/15= 1

Dus het is nu vertaald naar: Wat is de kans dat de z-score tussen -1 en 1 ligt? P(Z<-1 of Z>1)

Tabel A→1.00 geeft een kans van 0.8413, dus 1-0.8413=0.1587
Hij is perfect symmetrisch, dus aan de andere kant heb je ook een kans van 0.1587
Samen 0.32 kans dat P(Z<-1 of Z>1), dus 1-0.32 = 0.68

68% heeft een IQ-score tussen 85 en 115.

,BLOK 2.2 = Inferentiële statistiek
Inferentiele statistiek: kijken of iets extreem is of niet

Stappen van de empirische cyclus van De Groot
1. Vraag, idee, veronderstelling, hypothese
2. Dat vertaal je naar iets wat je kan toetsen
3. Je gaat het toetsen
4. Uit die toetsing komt iets: conclusie/evaluatie, die beantwoordt je oorspronkelijke vraag
5. Conclusie beantwoordt de vraag (antwoord) en kan zelf weer dienen als observatie die een
nieuwe vraag oplevert

Voorbeeld:
1. Idee: Is kauwgom van invloed op prestaties? Dit is te algemeen, dus kan je nog niet toetsen.
(veronderstelling: met kauwgum presteer je beter)
2. Vertalen in H0: er is geen verschil, beide groepen gelijk (kauwgum kauwers scoren hetzelfde
als mensen die geen kauwgum kauwen)
Ha: er is wel verschil, beide groepen zijn niet gelijk
3. Je toetst altijd de H0, want bewijzen dat iets bestaat kan niet. Je kan wel aantonen dat iets niet
bestaat(falsificeren). Je geeft de ene helft wel en de andere helft geen kauwgum. Je krijgt twee
gelijkwaardige groepen, met random sampling. (waarom niet gewoon zelf indelen? → niet
representatief, want je kan ze alleen indelen op wat je wel van ze weet. De groepen kunnen
dan erg verschillen op basis van iets anders)
Je toetst, omdat je eigenlijk nooit de hele groep kan onderzoeken.
➔ Het maken van twee gelijkwaardige groepen = randomiseren
➔ Onafhankelijke variabele = welke groep
➔ Afhankelijke variabele = prestaties
4. Hoe extreem moet een uitkomst zijn voordat je de H0 verwerpt?
Ga uit van H0=6.9 en Ha≠6.9
Je trekt een steekproef en die steekproef heeft een gemiddelde van 7.5
Die 7.5 is niet gelijk aan 6.9, maar is het zó veel hoger dan 6.9 dat je moet concluderen dat
kauwgumkauwen werkt? Om dat te bepalen, ga je kijk hoe extreem deze bevinding is.
Hoe groot is de kans op een 7.5 of hoger? Is die kan heeeel klein (α<0.05) is, dan verwerp je
de H0 want dan is het onaannemelijk dat je die 7.5 vindt als H0 klopt, dus verwerp je het
5. H0 verwerpen in dit geval, want α<0.05

Je toetst altijd de H0, omdat het onmogelijk is om iets te bewijzen met 100% zekerheid. Je kan wel
falsificeren: bewijzen dat iets niet zo is.

Voorbeeld koe: als je wil bewijzen dat paarse koeien bestaan zou je bij elke koeiengeboorte ter wereld
aanwezig moeten zijn. Dat is niet mogelijk, dus bewijzen dat het bestaat kan niet. Het
tegenovergestelde wel; als je 1 ding ziet wat het tegenspreekt, weet je al genoeg.

Stappen
1. Formuleer de H0 en Ha (eenzijdig of tweezijdig!)
2. Analyseprocedure(Z-toets) en beslisregel(significantieniveau=0.05, tweezijdig) kiezen
3. Trek een steekproef
4. Referentieverdeling (is niet de verdeling van individuele scores in je populatie, ook niet de
verdeling van individuele scores van je steekproef, het is wel de gemiddelde score)
Berekenen van de toetsingsgrootheid uit de data
5. (Z-toets doen→Z-score→P-waarde berekenen (bijv. 0.0045)
P-waarde bepalen
6. Beslissen, p-waarde<significantieniveau (hier: 0.0045<0.025) dus verwerpen H0
Dus kauwgum werkt.

,De stappen met ons voorbeeld:
1. H0: μkauwgum = μgeen_kauwgum = 6.9
Ha: μkauwgum ≠ 6.9
2. Analyseprocedure is de z-toets
Beslisregel is het significantieniveau, dat is 0.05 en tweezijdig (dus als de kans op de H0 5% of
minder is, dan is je steekproef zo onaannemelijk dat je H0 verwerpt)
3. In de populatie μ=6.9 en σ=2.3
In de steekproef 𝑥̅ obs=7.5 en sobs=2.1
Werkt kauwgum nu echt?
4. Hoe groot is de kans op een gemiddelde van 7.5 of hoger, als H0 waar is?
De referentieverdeling is belangrijk (niet de verdeling van individuele scores in je populatie
EN niet de verdeling van individuele scores in je steekproef)→gaat om gemiddeldes.
Je weet wat het gemiddelde moet zijn→6.9
𝜎 2.3
Je weet ook de standaarddeviatie: 𝜎𝑥̅ = 𝑁 = 100 = 0.23 van de verdeling van
√ √
steekproefgemiddelden
1. Bepaal de positie op de referentieverdeling (bereken gemiddelde en SD)
𝑥̅ −𝜇 7.5−6.9
2. Bereken de toetsingsgrootheid 𝑧 = 𝑜𝑏𝑠𝜎 𝑥̅ = 0.23 = 2.61
̅
𝑥
3. Je zoekt de kans op die bij die waarde hoort→=0.0045
5. Bereken de p waarde
𝑝 = 𝑃[𝑍 ≥ 2.61|𝐻0 ] = 0.0045 (𝑒𝑒𝑛𝑧𝑖𝑗𝑑𝑖𝑔)
6. Beslissing: p-waarde<significantieniveau (0.025), dus je verwerpt H0
Conclusie voor populatieniveau: er is genoeg bewijs dat kauwgum werkt.




Voordeel eenzijdig toetsen: meer kans om iets te vinden
Nadeel eenzijdig toetsen: als je aan de verkeerde kant kijkt, dan mis je het hele resultaat
Dus kies altijd tweezijdig (veiliger), tenzij je hypothese alleen stijging of daling bevat.

,College 2 – hoofdstuk 8 MMC
Statistische Schatting
Statement: De lucht is blauw
- Is dit waar of niet? Hoe check je dit?

H0: er is GEEN verschil in groepsgemiddelden / gemiddelde is gelijk aan nul

De referentieverdeling gaat niet om individuele scores van steekproef, ook niet de populatiescores,
maar het gaat om gemiddelde scores. Het is een verdeling van alle mogelijke gemiddeldes die je zou
kunnen krijgen als je dezelfde soort steekproef als die je nu hebt uit de populatie trekt.
(als uit elke steekproef het gemiddelde berekent en dan die gemiddeldes gaat plotten, dan krijg je de
referentieverdeling.). Het gemiddelde van die referentieverdeling is gelijk aan het gemiddelde van de
populaltie.

In praktijk werk je niet met populaties, dat is veel te veel werk.


Als je deze grenzen uitrekent, kun je bepalen hoe
dichtbij het steekproefgemiddelde zit bij het
populatiegemiddelde (hoe nauwkeurig is het
steekproefgemiddelde als schatter voor het
populatiegemiddelde?)

, 95% confidence interval
Doe je nou veel steekproeven, en bereken je van elke het gemiddelde en daar doe je twee keer de
stadaarderror bij optellen en aftrekken. Doe je dat voor elke steekproef, dan zal 95% van al die
intervallen de ware populatiewaarde bevatten.
(de standaarderror ligt vast door de referentieverdeling, die verandert niet per steekproef)

Het algemene idee: de steekproefverdeling van 𝑥̅ vertelt ons hoe dichtbij μ waarschijnlijk bij het
steekproefgemiddelde 𝑥̅ zal liggen.

Het niveau C betrouwbaarheidsinterval voor een parameter heeft twee delen:
1. Een interval met de vorm ‘schatting ± margin of error’ (𝑚 = 𝑧 ∗ 𝜎/√𝑛)
2. Betrouwbaarheidsniveau C, waar C de kans is dat het interval de ware parameterwaarde zal
vangen in herhaalde steekproeftrekkingen. Het betrouwbaarheidsniveau is een soort mate van
succes voor de methode.
Hoe smaller je interval, hoe nauwkeuriger je aan het meten bent.

Bepalen van de steekproefgrootte
Het betrouwbaarheidsinterval voor een populatiegemiddelde zal een bepaalde (maximale) margin of
error m hebben, als de steekproefgrootte als volgt wordt bepaald:
(hoe groot moet je steekproef zijn om met een bepaalde precisie te kunnen meten?)




Steekproefverdeling van één steekproefproportie
Als je in veel steekproeven de proportie uitrekent en die plot, dan heb je weer een referentiedistributie,
die Normaal verdeeld is.
Op basis van 1 steekproef kan je bepalen hoe die verdeling er uit ziet.

De standaarderror bepaal je ook op basis van 1 steekproef, dat doe je met




Betrouwbaarheidsinterval voor een proportie
CI=schatting ± margin of error’
Je schatting is nu je steekproefproportie (ipv steekproefgemiddelde)
𝑚 = 𝑧 ∗ 𝜎/√𝑛

de standaard error is nu:

De kritieke z-waarde die je kiest, hangt er van af
hoeveel van mijn verschillende confidence intervallen
ook echt de echt waarde bevatten.

Documentinformatie

Geüpload op
3 oktober 2018
Aantal pagina's
50
Geschreven in
2017/2018
Type
SAMENVATTING
€5,99
Krijg toegang tot het volledige document:

Verkeerd document? Gratis ruilen Binnen 14 dagen na aankoop en voor het downloaden kun je een ander document kiezen. Je kunt het bedrag gewoon opnieuw besteden.
Geschreven door studenten die geslaagd zijn
Direct beschikbaar na je betaling
Online lezen of als PDF


Ook beschikbaar in voordeelbundel

Thumbnail
Voordeelbundel
Bundel van college- en bloksamenvatting blok 2.2
-
3 2 2019
€ 8,99 Meer info

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
esmeecoppoolse Erasmus Universiteit Rotterdam
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
164
Lid sinds
9 jaar
Aantal volgers
111
Documenten
94
Laatst verkocht
2 weken geleden

3,6

31 beoordelingen

5
8
4
9
3
10
2
1
1
3

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Bezig met je bronvermelding?

Maak nauwkeurige citaten in APA, MLA en Harvard met onze gratis bronnengenerator.

Bezig met je bronvermelding?

Veelgestelde vragen