Geschreven door studenten die geslaagd zijn Direct beschikbaar na je betaling Online lezen of als PDF Verkeerd document? Gratis ruilen 4,6 TrustPilot
logo-home
Samenvatting

Statistiek 2 Samenvatting Hoorcolleges en Agresti

Beoordeling
4.0
(1)
Verkocht
3
Pagina's
54
Geüpload op
18-03-2021
Geschreven in
2020/2021

deze samenvatting bevat mijn aantekeningen van alle hoorcolleges en korte samenvattingen van belangrijke punten uit het boek

Instelling
Vak

Voorbeeld van de inhoud

Week 1
Hoorcollege 1.1
Waarom hebben we statistiek nodig?
Als je een uitspraak maakt, dan moet je daar wel onderzoek naar hebben gedaan. Daarvoor heb je
statistiek nodig.
Bij een onderzoek trekken we een random steekproef waarbij we hopen dat deze representatief is
voor de samenleving.

Herhaling statistiek 1 (hoofdstuk 1 t/m 4)

Meetniveaus van variabelen

- Een variabele is een eigenschap die kan variëren tussen eprsonen in een steekproef of
populatie
- Het meetniveau van een variabele bepaalt de statistische methoden die gebruikt kunnen
worden
- Variabelen hebben elk een eigen meetniveau

Meetniveaus :
Gewicht = ratio (absoluut nulpunt)
Studierichting = nominaal (geen volgorde)
Aantal appelen in een zak = ratio
Somscore op angstvragenlijst = interval/ maar ordinaal kan ook

- Nominaal : op zijn hoogst indeling in ongeordende categorieën.
Classificatie als wel/niet ‘behoren tot dezelfde categorie’. Codering kan met cijfers, letters of
symbolen
- Ordinaal : op zijn hoogst indeling in geordende categorieën.
Classificatie als ‘groter dan, gelijk, en kleiner dan’. Rangordening kan op twee manieren:
hoog naar laag; laag naar hoog. (nominaal en ordinaal samen categorisch)
- Interval : maakt naast ordening ook verschillen interpretabel door gelijke meeteenheden.

Meeste methoden zijn parametrische methoden (vooral geschikt voor interval en ratio)
(non-parametrische methoden zijn minder bekend en gebruikt. In de praktijk toch vaak
parametrische methoden gebruikt voor ordinale en discrete data met veel mogelijke waardes (bijv.
likert-schalen)

Beschrijvende statistiek : = Het samenvatten van de data middels tabellen en figuren.
(kan per variabele, maar kan ook voor meerdere variabelen tegelijk, dan kijk je naar de
samenhang/verband)
Eerst kijken naar kwantitatieve of categorische variabelen.

- Het samenvatten van de data middels tabellen en figuren.
- Samenvatten per variabele (verdling), samenvatten voor meerdere variabelen (samenhang)
- Verschillende beschrijvende statistieken voor categorische versus kwantitatieve data
- Zorg er voor dat je data altijd eerst exploreert voordat je werkelijk gaat analyseren!

Histogram, stem and leaf plot. Tabellen, figuren, Kan ook in woorden beschrijven.
u-vormige verdeling vaak bij politieke kwesties
soms wil je ook echt cijfers geven aan dingen die je wilt weten. (gemiddelde, mediaan, modus)

,bi-modaal




formulevan het gemiddelde =

Maar het gemiddelde zegt niet alles.

- Range (verschil tussen max en min)

Mate die we veel gebruiken is deviatie →
Deviatiescore = de afwijking ten opzichte van de gemiddelde score
(je wilt weten hoever het van het gemiddelde ligt. Dit doe je door het te kwadrateren)
Variantie = kwadratensom / n-1  s^2
Wortel s = standaarddeviatie (gemiddelde deviatie)

Empirische regel – handig bij een normaalverdeling

Klassificeren (‘measures of position’)

- Kwartielen : hakken data in vier gelijke delen
- Interkwartielafstand (IQR) : verschil tussen eerste en derde kwartiel
- Outlier : als score 1.5 X IQR boven/onder 3e/1e kwartiel
- Voorbeeld van boxplot tentamenscores :

Kansverdelingen :

Kansverdelingen nodig om te snappen waarom x genoeg is
voor een onderzoek.

- Kans : de kans dat een observatie een bepaalde
waarde aanneemt
- Random variabele : elke mogelijke waarde van variabele heeft een bepaalde kans
- Kansverdeling : alle mogelijke waardes van variabele en hun kansen
• Discrete kansverdelingen :
o Elke mogelijke waarde heeft een kans
o Histogram, met op de y-as de kansen
• Continue kansverdeling :
o Oneindig aantal mogelijke waardes, kans voor gekozen intervallen van waardes
o Figuur met kans = oppervlakte onder de curve

3 soorten kansverdelingen :

- Verdelingen van variabelen in de populatie
- Verdelingen van variabelen in de steekproef
- Verdelingen van steekproefgrootheden

Sommige kansverdelingen benaderen de wereld goed
Sommige kansverdelingen zijn belangrijk omdat ze bij het bedrijven van statistiek handig zijn
In beide gevallen speelt de normaalverdeling een belangrijke rol!

,z-scores :




Om de kans voor y te bepalen, gevruik z=y-µ)/σ, daarna kans in z-tabel opzoeken.

Om y-waarde te vinden voor gegeven kans, gebruik y=µ+z x σ

Als ruwe data normaal verdeeld, conversie naar z geeft standaard normaalverdeling

Doel statistiek = op basis van een steekproef uitspraak doen over de populatie

- Populatieverdeling : populatie gemiddelde µ is (vaak onbekende) parameter. (onbekend,
want je gaat meestal niet de hele populatie tellen/meten)
- Steekproefverdeling : steekproefgemiddelde Ῡ is steekproefgrootheid ( sample statistic)
- Steekproevenverdeling : verdeling van steekproefgrootheid over steekproeven heen




Steekproef en vertrouwen :

- Doel statistiek = op basis van een steekproef uitspraak doen over de populatie
- Uitspraak meestal over gemiddelde of proportie
o Stel : grote bak met knikkers (rood en blauw): op basis van een steekproef 2 knikkers
schat proportie blauw
o Stel : jullie zijn de populatie, bepalen hoe slim jullie zijn op basis van 2 willekeurige
studenten die IQ-test maken
- Weinig vertrouwen, want door kleine steekproef kan schatting nogal afwijkend zijn.
- Naarmate je meer obseraties ziet heb je steeds meer vertrouwen, maar hoeveel is genoeg?

, Hoorcollege 1.2
Dus :

- Hoe meer proefpersonen in de steekproef, hoe kleiner de kans dat extreme waarden
toevallig niet gecompenseerd worden
- De verdeling van het steekproevengemiddelde wordt smaller naarmate we meer
proefpersone hebben
- Dat zie je ook terug in de formule voor de standaardfout :

Centrale limietstelling :

Ongeacht de verdeling van een variabele in de populatie, ligt bij toenemende N de
steekproevenverdeling van Ῡ steeds dichterbij µ en lijkt de verdeling steeds meer op de
normaalverdeling. Daarom gebruiken we de normaalverdeling zo vaak!

Gemiddelde = t-toets

Voorbeeld dit college = zwanger en roken
‘in een steekproef van 30 tijdens de zwangerschap zwaar rokende vrouwen is de gemiddelde lengte
van de kinderen 50 cm met een standaardafwijking van 1 cm. ‘

- Schat het gemiddelde
- Bepaal betrouwbaarheidsinterval van het gemiddelde
- Toets of gevonden gemiddelde van lengte in algemene populatie kinderen afwijkt

Schattingstheorie :

- Puntschatting ; de beste gok die je kunt doel
o Een schatter is een steekproeffunctie op basis waarvan een populatieparameter
wordt geschat.
o Kwaliteit van de schatter wordt
uitgedrukt in :
▪ Zuiverheid (unbiased)
▪ Doeltreffendheid (efficient)

- Intervalschatting ; een interval om de
puntschatting waarbinnen men vermoedt dat parameter ligt.

In het boek gaat het om proporties en gemiddelden. In dit college gaat het alleen om het
gemiddelde.

Betrouwbaarheidsintervallen :

Een betrouwbaarheidsinterval voor een parameter is een intevral van getallen waarvan men gelooft
dat parameter ligt
De betrouwbaarheidsniveau is de kans dat methode resulteert in interval dat parameter bevat.
meestal is deze 95 of 99%
Basis voor BI is steekproevenverdeling van puntschatting. Deze is vaak normaal verdeeld

We kennen de waarschijnlijkheid van de schatting gegeven de parameter. Ongeveer 95% van de
verdeling ligt binnen twee standaardfouten van parameter (empirische regel).

Gekoppeld boek

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Heel boek samengevat?
Nee
Wat is er van het boek samengevat?
Hoofdstuk 10 t/m 14
Geüpload op
18 maart 2021
Aantal pagina's
54
Geschreven in
2020/2021
Type
SAMENVATTING

Onderwerpen

$5.38
Krijg toegang tot het volledige document:

Verkeerd document? Gratis ruilen Binnen 14 dagen na aankoop en voor het downloaden kun je een ander document kiezen. Je kunt het bedrag gewoon opnieuw besteden.
Geschreven door studenten die geslaagd zijn
Direct beschikbaar na je betaling
Online lezen of als PDF

Beoordelingen van geverifieerde kopers

Alle reviews worden weergegeven
1 jaar geleden

4.0

1 beoordelingen

5
0
4
1
3
0
2
0
1
0
Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
WendyvHouten Vrije Universiteit Amsterdam
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
15
Lid sinds
5 jaar
Aantal volgers
13
Documenten
7
Laatst verkocht
1 jaar geleden

4.5

2 beoordelingen

5
1
4
1
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Bezig met je bronvermelding?

Maak nauwkeurige citaten in APA, MLA en Harvard met onze gratis bronnengenerator.

Bezig met je bronvermelding?

Veelgestelde vragen