Geschreven door studenten die geslaagd zijn Direct beschikbaar na je betaling Online lezen of als PDF Verkeerd document? Gratis ruilen 4,6 TrustPilot
logo-home
Samenvatting

Samenvatting Statistiek 2: Vrije Universiteit Amsterdam, Hoorcolleges en Boek, Alan Agresti & Barbara Finlay. Statistical Methods For The Social Sciences.

Beoordeling
3.7
(3)
Verkocht
9
Pagina's
84
Geüpload op
16-03-2019
Geschreven in
2018/2019

Met behulp van deze samenvatting hebben wij voor ons tentamen een 7,2 en een 9,6 gehaald. In deze samenvatting wordt gebruik gemaakt van de colleges van Statistiek 2 aan de Vrije Universiteit in Amsterdam (schooljaar 2018/2019). Ook zijn de hoofdstukken 10 t/m 14 van het boek Alan Agresti & Barbara Finlay (2009). Statistical Methods For The Social Sciences. Pearson Education International. Samengevat. Ook worden heel kort in twee colleges de stof uit de hoofdstukken 1 t/m 9 herhaald. Hiervan hebben wij al eerder een samenvatting gemaakt die je kunt kopen.

Meer zien Lees minder
Instelling
Vak

Voorbeeld van de inhoud

Inleiding
__________________________________________________________________________________

In deze samenvatting wordt gebruik gemaakt van de colleges van Statistiek 2 aan de Vrije Universiteit
in Amsterdam (schooljaar 2018/2019).
Ook zijn de hoofdstukken 10 t/m 14 van het boek Alan Agresti & Barbara Finlay (2009). Statistical
Methods For The Social Sciences. Pearson Education International. Samengevat.

Ook worden heel kort in twee colleges de stof uit de hoofdstukken 1 t/m 9 herhaald. Hiervan hebben
wij al eerder een samenvatting gemaakt die je kunt kopen.

Veel succes met het leren voor het tentamen!

,Hoorcolleges gekoppeld aan Agresti, Statistiek 2
Hoorcollege 1.1

Variabelen en hun meetniveau
Een variabele is een eigenschap die kan variëren tussen personen in een steekproef of populatie.
Het meetniveau van een variabele bepaalt de statistische methoden die gebruikt kunnen worden.
Variabelen hebben elk een eigen meetniveau.
Meetniveaus: nominaal: categorische variabelen (studierichting), ordinaal: geordende categorieën,
interval: gelijke meeteenheden en ratio: absoluut nulpunt (gewicht, appelen in een zak).

Continue variabelen: oneindig aantal waarnemingen
Discrete variabelen: aantal broers of zussen, afgeronde eenheden/niks tussen

Meeste methoden voor interval en ratio (parametrische methoden).
Nonparametrische methoden minder bekend en gebruikt (bv. WIlcoxon of Friedman.
In praktijk tot vaak parametrische methoden gebruikt voor ordinale en discrete data met veel
mogelijke waardes (bv. Likert-schalen).

Beschrijvende statistiek:
Het samenvatten van de data middels tabellen en figuren.
Samenvatten per variabele (verdeling), samenvatten voor meerdere variabelen (samenhang).
verschillende beschrijvende statistieken voor categorische versus kwantitatieve data.
Zorg ervoor dat je data altijd eerst exploreert voordat je werkelijk gaat analyseren.

Beschrijvende statistiek -voor categorische data
Frequenties en staafdiagrammen. Vul aan De alpha is de kans dat H0 ten onrechte wordt verworpen.
-voor kwantitatieve data (Continue waardes)
Frequenties, histogram en stem-and-leaf plot.

Verdelingen in woorden gaan beschrijven
4 type verdelingen die je in je data terug kunt zien: normaal verdeling (meeste waardes rond het
gemiddelde), u-vormige verdeling (bijna niks rond het gemiddelde, juist rond extreme kanten. Denk
aan debat vaccinatie), scheve verdeling: naar rechts (onderzoek naar psychopathologieën, meeste
rond gemiddelden, sommigen wijken er extreem vanaf) en scheef naar links (hoe goed kan iemand
een tekst schrijven).

Beschrijven van data centrum: gemiddelde, mediaan en modus.
Gemiddelde zegt niet alles, je wilt de variantie weten. Door bijv. de range te geven (verschil tussen
max en min). Deviatie (yi-ybar). Kwadraatsommen M(yi-ybar)2. Variantie en standaarddeviatie.

De empirische regel. Als het histogram van de data ongeveer klokvormig is. Dan ligt:
Ongeveer 68% van de waarnemingen tussen 1 sd onder en boven gemiddelde
Ongeveer 95% van de waarnemingen tussen 2sd onder en boven gemiddelde
bijna alle waarnemingen tussen 3 sd onder en boven gemiddelde

Classificeren
kwartelen: hakken data in vier gelijke delen
interkwartielafstand (IQR): verschil tussen eerste en derde kwartiel
Outlier: als score 1,5* IQR boven/onder 3 de/1ste kwartiel.

,Kans: de kans dat een variabele een bepaalde waarde aanneemt
random variabele: elke mogelijke waarde van variabele heeft een bepaalde kans.
Kansverdeling: alle mogelijke waardes van variabelen en hun kansen.

-Discrete kansverdelingen:
Elke mogelijke waarde heeft een kans.
histogram, met op de y-as kansen
-continue verdelingen:
Oneindig aantal mogelijke waardes, kans voor gekozen intervallen van waardes
figuur met kans = …

3 verschillende type kansverdelingen
-verdelingen van variabelen in de populatie &in de steekproef
-verdelingen van steekproefgrootheden.

IQscores Nederlandse bevolking:
Meerdere steekproeven getrokken, proefpersonen maken IQ-test. IQ is verdeeld met mu=…
 Thuis kijken


Hoorcollege 1.2.
Categorische variabelen: beschrijven door proporties en percentages
continue/kwantitatieve variabelen: waarde omzetten in intervallen

Frequentieverdelingen: gemiddelde, centrummaten, spreiding, positiematen (range, kwartielen in
data) beschrijven.

Voorbeeld uit de wetenschapswereld: herhalen van studies (studies die waar zijn), sommige zijn
terug naar originele studies gegaan, op dezelfde manier herhalen: je verwacht in 5% van de studies
dat de scores afwijken. Maar blijken veel meer te zijn. 100 studies herhaalt, meer dan de helft niet
repliceerbaar. Waarom is het goed dat dit aan het licht kwam: veel transparanter met data omgaan,
hoe analyseren, hoe steekproef getrokken en op basis daarop beslissingen zijn gemaakt. Subsidie
wordt gegeven aan replicatieonderzoek, dat is mooi.

Normaal verdeeld als je steekproef voldoende omvang heeft: steekproevenverdeling. Het
gemiddelde daarvan is ongeveer het populatiegemiddelde, een goede schatting van
populatieparameter. Je kunt er ook spreiding, variatie in zien (standaarderror, standaardafwijking in
je steekproevenverdeling . Dit noem je fout: dat is je marge waarmee je er in je steekproef naast kunt
zitten. Mu is populatieverdeling. Spreiding in de steekproevenverdeling (populatie) is de


standaardfout.
Weinig spreiding in je populatie, wordt deze kleiner.
Twee andere termen voor Alpha zijn: significantieniveau en type 1 fout.
Betrouwbaarheidsintervallen (meer info, waarbinnen ligt populatieparameter) zijn informatiever dan
significantietoetsen (wel/niet sig).
Voor toetsen van gemiddelde wordt de t-toets gebruikt. Z-toets bij proporties.

In een steekproef van 30 tijdens de zwangerschap zwaar rokende vrouwen is de gemiddelde lengte
van de kinderen 50 cm met een standaardafwijking van 1 cm.
-schat het gemiddelde (populatie van alle kinderen van zwaarrokende vrouwen)

, -bepaal betrouwbaarheidsinterval gemiddelde (hoe zeker hiervan, zit er foutenmarge in?)
-toets of gevonden gemiddelde van lengte in algemene populatie kinderen afwijkt. (van niet-
rokende)

Schatten gemiddelde: (op basis van onze steekproef)
-puntschatting: de beste gok die je kunt doen over populatieparameter
Vooral kijken naar gemiddelden. Een schatter is een teekproeffunctie op basis waarvan een
populatieparameter wordt geschat.
De kwaliteit van een schatter wordt uitgedrukt in: zuiverheid (unbaised), doeltreffendheid (efficiënt)

-intervalschatting: een interval om de puntschatting waarbinnen met vermoedt dat parameter ligt.
-boek: proporties/gemiddelden. Nu richten op gemiddelden.

 Schat het gemiddelde: is dus 50, weten dat het steekproefgemiddelde een zuivere, efficiënte
schatter is van de mu (populatiegemiddelde). Maar we weten ook dat het een steekproef is..
Betrouwbaarheidsinterval rondom schatten: foutenmarge aan beide kanten rondom je puntschatter.
Hoe groot moet het interval zijn:
-een betrouwbaarheidsinterval voor een parameter is een interval van getallen waarvan met gelooft
dat parameter daarin ligt.
-het betrouwbaarheidsinterval is de kans dat methode resulteert in interval dat parameter bevat.
Meestal is deze 95% of 99%.
-bevat het betrouwbaarheidsinterval geen 0-> verwerp de H0.

-basis voor BI is teekproevenverdeling van puntschatting. Vaak is deze normaal verdeeld (centrale
limietstelling). We kennen de waarschijnlijkheid vd schatting gegeven de parameter. Ongeveer 95%
vd verdeling ligt binnen twee standaardfouten van parameter (empirische regel). De breedte van het
BI: -neemt toe als de betrouwbaarheid stijgt. -neemt af als de steekproef groter wordt.

Met een betrouwbaarheidsniveau van 0.95, is er een kans van 5% dat het interval rondom de
puntschatter de parameter niet bevat. Voor één steekproef is onbekend of populatiewaarde in
interval ligt. Het betrouwbaarheidsniveau is dus lange termijn proportie correct!




s = standaardafwijking
Moeten we sigma uit de data schatten met s op basis van onzekere ybar. Niet langer
normaalverdeling gebruiken voor toetsing! Maar t- verdeling die wel lijkt op normaalverdeling, maar
met dikkere staarten. Gelijkenis hangt af van n en aantal vrijheidsgraden.

Vrijheidsgraden, degrees of freedom in het Engels (df):
-belangrijk bij kleine steekproeven. Ook bij variantieanalyse en andere procedures later in cursus.
-Bij parameterschatten (zoals de SD), df afhankelijk van de restricties op de observaties. Eén df
verdwijnt voor iedere restrictie. – bij bestuderen verklarende kracht (kijken naar residuele variantie)
rekening houden met aantal parameters gebruikt. Dat verlies je op je N.

Gekoppeld boek

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Heel boek samengevat?
Nee
Wat is er van het boek samengevat?
10 t/m 14
Geüpload op
16 maart 2019
Aantal pagina's
84
Geschreven in
2018/2019
Type
SAMENVATTING

Onderwerpen

$7.79
Krijg toegang tot het volledige document:
Gekocht door 9 studenten

Verkeerd document? Gratis ruilen Binnen 14 dagen na aankoop en voor het downloaden kun je een ander document kiezen. Je kunt het bedrag gewoon opnieuw besteden.
Geschreven door studenten die geslaagd zijn
Direct beschikbaar na je betaling
Online lezen of als PDF


Ook beschikbaar in voordeelbundel

Beoordelingen van geverifieerde kopers

Alle 3 reviews worden weergegeven
6 jaar geleden

6 jaar geleden

6 jaar geleden

3.7

3 beoordelingen

5
1
4
0
3
2
2
0
1
0
Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
Orthopedagoog4 Vrije Universiteit Amsterdam
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
279
Lid sinds
11 jaar
Aantal volgers
179
Documenten
2
Laatst verkocht
3 maanden geleden
Samenvattingen voor de (pre)master Pedagogische Wetenschappen

3.7

38 beoordelingen

5
7
4
20
3
7
2
1
1
3

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Bezig met je bronvermelding?

Maak nauwkeurige citaten in APA, MLA en Harvard met onze gratis bronnengenerator.

Bezig met je bronvermelding?

Veelgestelde vragen