Samenvatting

VU Statistiek 1 Samenvatting Boek & Colleges (goed voor een 8.0!)

Name: VU Statistiek 1 Samenvatting Boek & Colleges (goed voor een 8.0!)
SKU: doc_902001
Rating: 4.29 (7 reviews)
Author: felicehijnens

Beoordeling

4.3

(7)

Verkocht

Pagina's

Geüpload op

03-12-2020

Geschreven in

2020/2021

Met deze samenvatting heb ik zelf een 8.0 gehaald! Dit is een samenvatting van het vak Statistiek 1. Alle relevante informatie komt hierin terug: theorie, formules, grafieken, voorbeelden. Alles wat niet in de samenvatting staat, komt dan ook niet terug in het tentamen.

Meer zien Lees minder

Instelling

Vak

Voorbeeld van de inhoud

Statistiek samenvatting

CH1 Introductie
Statistiek = inductie (specifiek > algemeen). Door middel van een bepaalde (steekproef-)
uitkomst iets zeggen over populatie.
Statistiek = wetenschap van het verzamelen, organiseren, interpreteren van numerieke
feiten, die gegevens of data worden genoemd.

Kansrekening > deductie (algemeen > specifiek): alle details weten van bepaalde populatie
en op basis daarvan uitspraken doen van bepaalde steekproefuitkomst
BIJ STATISTIEK ANDERSOM! > inductie (specifiek > algemeen): mbv bepaalde
steekproefuitkomst uitspraken doen over populatie

Methodologie: systematische wijze van hoe je onderzoek zou moeten uitvoeren
Statistiek: instrumentarium (‘’gereedschap’’) om empirisch (zintuigelijk) onderzoek uit de
kunnen voeren
Deze twee kunnen niet zonder elkaar, maar zijn wel verschillend!

Trekken van conclusies op basis van weerleggen = falsificatie (bewijs tegen de hypothese)

CH2 Sampling and Measurement
Twee soorten statistiek
1. Beschrijvend = data van populatie/steekproef met nummers, tabellen en grafieken
2. Inferentiële = voorspellingen over populatie parameters, gebaseerd op
steekproefdata (inductie) > uitspraken doen over populatie

Meetschalen: NOIR
Categorie > Nominaal: ongeordend (kleur ogen, geslacht, bloedgroep, politieke partij)
Ordinaal: geordend (opleidingsniveau, inkomensgroepen, goud/zilver/brons)
Kwantitatief > Interval: gelijke afstand tussen opeenvolgende waarden (graden Celsius, IQ)
Ratio: gelijke afstand met absoluut nulpunt (alle percentages, leeftijd,
gewicht, inkomen in euro’s)

Discreet = ondeelbaar (aantal broers/zussen, aantal keer dat je met dobbelsteen gooit)
Continu = deelbaar (lengte, gewicht)

Steekproefproblemen met inferentiële statistiek
 Sampling error: toevallige steekproefverschillen
 Sampling bias: selectieve werving
 Response bias: incorrect antwoord
 Non-response bias: selectieve deelname

Data: observaties van karakteristieken
 Populatie: voorbeeld parameters = gemiddeld aantal uren online zelfstudie van
alle studenten
 Steekproef: voorbeeld steekproefgrootheid = gemiddeld aantal uren online
zelfstudie van de studenten in de steekproef

,Betrouwbaarheid: hoe betrouwbaar is je meting
Valide: als je niet meet wat je denkt dat het is

Doel: steekproefgrootheden dienen niet te verschillen van populatiegrootheden

Steekproefmethoden
1. Enkelvoudige steekproef
2. Systematische aselecte steekproef
3. Gestratificeerde steekproef
4. Cluster steekproef
5. Getrapte steekproef

Randomiseren > representatieve steekproef trekken
Verschil cluster en gestratificeerde steekproef
Gestratificeerde steekproef (karakteristieken > meisje/jongen)
- Hele groep ondervragen, gaat meestal om bestaande groepen (klas, team)
- Binnen ieder stratum steekproef getrokken
- Proportioneel of disproportioneel
- Handig bij duidelijke categorieën die verschillen in omgeving
Cluster steekproef (geen verschillen in categorieën > scholen)
- Groep opdelen in deelpopulaties (groep wijkbewoners verder opdelen in
bijvoorbeeld alle vrouwen uit de wijk)
- Niet vergelijken: praktische overwegingen
- Verdeel populatie in clusters & trek aselect aantal clusters
- Alle subjecten van getrokken cluster kiezen
- Handig als het moeilijk is om alle clusters te bereiken voor steekproef

CH3 Beschrijvende Statistiek
Beschrijvende statistiek
 Centrum (typische observatie)
 Variatie (spreiding van observaties)
 Positie (relatieve positie van observaties)

Centrummaten
Gemiddelde = som waarnemingen / n
Modus = meest gegeven antwoord
Mediaan = middelste antwoord

,Spreidingsmaten
Bereik = range
Standaarddeviatie
Interkwartielafstand = maat voor spreiding van een verdeling; mate waarin waarden
onderling verschillen

Positiematen
Percentielscore
Kwartiel
Minimum/maximum
Mediaan
Z-score

Univariaat = één variabele
Bivariaat = twee variabalen (correlatie)

1 punt in scatterplot = 1 observatie
Hoe groter steekproef, hoe kleiner steekproeffout

Box-and-whiskler plot > dataset

CH4 Kansverdelingen
Waarschijnlijkheid > bepaalde uitkomst: proportie van aantal keer dat uitkomst voorkomt in
meerdere observaties

Kansen: regels
 P (A): kans dat A plaatsvindt
 P (not A) = 1 – P(A): kans dat A niet plaatsvindt
 P (A or B) = P(A) + P(B): kans dat A of B plaatsvindt
 P (A&B) = P(A) x P(B): kans dat A en B plaatsvindt

,Discreet > bepaalde set aan mogelijkheden: kans voor elke apart waarde kan berekend
worden (dobbelsteen)
Continu > oneindig aantal mogelijkheden: kans voor intervallen (lengte)

 Populatieverdeling: kansverdeling van de verschillende uitkomstmogelijkheden van
een variabele, zoals in totale populatie waargenomen (, , N)

 Steekproefverdeling: kansverdeling van een specifieke steekproef (ȳ, s, n)

 Steekproevenverdeling: kansverdeling voor verschillende waarden van een
steekproefgrootheid > groot aantal willekeurige steekproeven getrokken uit
populatie (ȳ,  ȳ (= /n), )

Bij symmetrie in grafiek = gemiddelde en mediaan hetzelfde!

Centrale Limietstelling: als je steekproefomvang groot genoeg is; resulterende
steekproevenverdeling zal zelf convergeren naar normaal verdeelde variabelen.
Voor willekeurige steekproeven met grote sample size n, nadert steekproevenverdeling van
steekproefgemiddelde ȳ een normaalverdeling.

Steekproevenverdeling (continue maat) versus populatieverdeling

Goed = kleine standaarddeviatie & kleine
standaardfout > hogere betrouwbaarheid
(sample size)

Centrale Limietstelling

,  Ongeacht vorm van de populatieverdeling > steekproevenverdeling zal bij benadering
normaal verdeeld zijn (significantie-toetsing & betrouwbaarheidsinvallen)
 Populatieverdeling scheef? > grotere steekproefomvang (N)
 Standaarddeviatie vd steekproevenverdeling (standaardfout) neemt toe als variantie
in y toeneemt & af als steekproefomvang toeneemt:  ȳ (= /n),

Dus: verkleinen variantie steekproef & vergroten steekproefomvang vergroot validiteit &
betrouwbaarheid van steekproefdata voor inferentiële statistiek.

Normaalverdeling
 Symmetrisch (vorm van bel)
 &
 1 stand.dev. > 0.68
 2 stand.dev. > 0.95
 3 stand.dev. > 0.997
 Positiemaat: Z-score = aantal stand.dev. dat y van  af is (z = (y - ) / )

Als waarde y bekend is en bijbehorende kans gezocht wordt, converteert y-waarde naar z-
score > cumulatieve kans (vb: hoeveel % vd NL vrouwen is korter of gelijk aan 170 cm?)
Cumulatieve kans berekend > converteer naar z-score en zoek y-waarde op (vb: vind 99ste
percentielscore van IQ)

Standaardnormaalverdeling >  = 0 met stand.dev.  = 1
Wanneer y-waardes uit normaalverdeling omgezet worden in z-score:
 Verdeling z = standaardnormaalverdeling
 Alle cumulatieve kansen van normaalverdeling bekend
 Gebruikt voor hypothesetoetsing in inferentiële statistiek

CH5 Inferentiële statistiek: schatting
Parameterschattingen
 Testen van hypothese voor populatie
 Gebaseerd op de verdeling van steekproefdata
1. ȳ is bekend en willen iets zeggen over 
2. verdeling ȳ is bekend, aannemende waarde voor 
3. afgaand op schatter ȳ, bepaal hoe onwaarschijnlijk hypothese of aanname voor  is

Parameterschatting
 Puntschatter = enkel getal dat als beste schatter dient voor parameter >
standaardfout geeft aan hoe precies schatter is
 Intervalschatter = interval rondom puntschatter, waarbinnen parameter naar
waarschijnlijkheid zal liggen > breedte geeft aan hoe precies schatting is
Goede schatters!
Valide: zuiver (unbiased) > onzuiver bij over- of onderschatting van parameter
Betrouwbaar: doeltreffend (efficiënt) > kleinere standaardfout = goed!
Verschillende vormen van kansverdelingen

,Steekproevenverdeling voor grote steekproeven kan worden benaderd door
normaalverdeling (z-verdeling)
Steekproef niet voldoende om effect te hebben en normaalverdeling benadering is
ongeschikt
 T distribution (t)
 Chi square distribution (2)
 Binominal distribution (B)

 Standaardnormaalverdeling (z-verdeling)
o Benadert steekproevenverdeling van steekproefproportie met relatief grote
samples
o Identiek voor verschillende sample sizes
o Standaarddeviatie = 1
o Symmetrisch rond gemiddelde = 0
o Populatiestandaarddeviatie = bekend
o Z-toets > steekproefproportie
 Student t-verdeling
o Van toepassing op steekproefverdeling van het steekproefgemiddelde
o Is verschillend voor verschillende steekproefgrootten
o Dikkere staart en meer gespreid dan standaardnormaalverdeling (kleine
steekproeven)
o Symmetrisch rond gemiddelde
o Populatiestandaarddeviatie = onbekend
o Convergeert naar standaardnormaalverdeling bij grotere steekproefgrootte
o T-toets > voor kwantitatieve variabelen (steekproef gemiddelden)
 Chi-squared variabele > kwalitatief (categorieën)
o Van toepassing op steekproefverdeling van de som van relatieve kwadraat
deviaties van verwachte frequenties (2)
o Scheef naar rechts, vooral wanneer paar deviaties worden opgeteld
o Convergeert naar normaalverdeling bij meerdere deviaties
o Chi-kwadraattoets > voor categorische variabele frequenties
 Binominaal
o Fixed sample size n
o Bij elke proef > even of interest komt voor of niet > gem: n x p,
standaarddeviatie: √ np(1− p)
o Probability (p) van voorkomen is bij elke proef anders
o Proeven afhankelijk van elkaar
o Convergeert tot normaalverdeling als sample size groter wordt
o Binominale toets > voor proporties met kleine steekproefgrootten

BI = betrouwbaarheidsinterval

BI (95%) voor populatieproportie
1. Bereken puntschatter (π)̂
2. Bepaal Z-score

, π^ ( 1− π^ )
3. Bereken standaardfout van puntschatter se =

4. Vul formule BI in: π̂ +/- z x se
√ n

Z = X −❑¿ ¿

Empirische regel:
68% binnen +/- 1 van gemiddelde
95% binnen +/- 2 van gemiddelde
Bijna 100% binnen +/- 3 van gemiddelde

BI (95%) voor populatiegemiddelde
1. Bereken puntschatter (ȳ)
2. Bepaal t-score (bijv. t = 1.96) behorende bij betrouwbaarheidsniveau én
vrijheidsgraden df = n -1
s
3. Bereken standaardfout se =
n
4. ȳ +/- t x se = 95% BI

Correcte interpretatie BI (95%)
- Populatiegrootheid ligt vast, maar is onbekend
- Steekproef (n) geeft puntschatter met bijbehorend betrouwbaarheidsinterval
- Herhaalde steekproeven
- 95% van de steekproeven zal BI opleveren dat daadwerkelijk populatiegrootheid
bevat

Foutmarge M van BI:
- Medebepaald door standaardfout vd schatter > hangt af van standaarddeviatie in
populatie & steekproefomvang
- Medebepaald door gewenste betrouwbaarheidsniveau (level of confidence)

Soorten frequenties:
- Absoluut: aantal keer dat het is geobserveerd
- Relatief: percentage vh totale aantal
- Valid: bijvoorbeeld > geen antwoord/blanco ingevuld = niet meetellen!
- Cumulatief: relatieve frequenties bij elkaar optellen van vorige waarde

Wanneer je steekproefgemiddelde gebruikt > steekproefcorrectie (n-1) toepassen

Fouten steekproef
1. Natuurlijke variatie tussen steekproeven
2. Door problemen/fouten binnen steekproef

Skipnumber k = N/n
N > populatie, n > steekproef

Meld schending auteursrecht

Gekoppeld boek

Alan Agresti, Barbara Finlay Statistical Methods for the Social Sciences, Global Edition

Uitgave:april 2018
ISBN:9781292220314
Druk:5

Geschreven voor

Instelling: Vrije Universiteit Amsterdam (VU)
Studie: Pedagogische Wetenschappen
Vak: Statistiek 1

Alle documenten voor dit vak (28)

Documentinformatie

Heel boek samengevat?: Nee
Wat is er van het boek samengevat?: Ch1 t/m ch9
Geüpload op: 3 december 2020
Aantal pagina's: 18
Geschreven in: 2020/2021
Type: SAMENVATTING

Onderwerpen

statistiek
toetsen
steekproef
normaalverdeling
beschrijvende statistiek
significantietoetsen
kansverdelingen
chi kwadraattoets
lineaire regressie
correlatie
samenvatting

$5.97

Krijg toegang tot het volledige document:

Gekocht door 20 studenten

Geschreven door studenten die geslaagd zijn

Direct beschikbaar na je betaling

Online lezen of als PDF

Maak kennis met de verkoper

felicehijnens

3.9

(15)

Beoordelingen van geverifieerde kopers

Alle 7 reviews worden weergegeven

madelonverkijk Pedagogiek · 10 beoordelingen

4 jaar geleden

amberasif Bachelor Toegepaste Psychologie · 10 beoordelingen

5 jaar geleden

ashnibiharie Pedagogische Wetenschappen · 2 beoordelingen

5 jaar geleden

imansalem Pedagogische Wetenschappen · 31 beoordelingen

5 jaar geleden

timoabbenes Pedagogische Wetenschappen · 6 beoordelingen

5 jaar geleden

arianahx Pedagogiek · 34 beoordelingen

5 jaar geleden

selin_6 Pedagogische Wetenschappen · 30 beoordelingen

3 jaar geleden

4.3

7 beoordelingen

Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

felicehijnens Academie voor Geesteswetenschappen

Bekijk profiel

Volgen

Verkocht

Lid sinds

8 jaar

Aantal volgers

Documenten

Laatst verkocht

2 jaar geleden

3.9

15 beoordelingen

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper felicehijnens. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor $5.97. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews) Afgelopen 30 dagen zijn er 52912 samenvattingen verkocht Opgericht in 2010, al 16 jaar dé plek om samenvattingen te kopen

VU Statistiek 1 Samenvatting Boek & Colleges (goed voor een 8.0!)

Voorbeeld van de inhoud

Gekoppeld boek

Geschreven voor

Documentinformatie

Onderwerpen

Beoordelingen van geverifieerde kopers

Maak kennis met de verkoper

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Niet tevreden? Kies een ander document

Betaal zoals je wilt, start meteen met leren

Bezig met je bronvermelding?

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Tevredenheidsgarantie: hoe werkt dat?

Van wie koop ik deze samenvatting?

Zit ik meteen vast aan een abonnement?

Is Stuvia te vertrouwen?