Geschreven door studenten die geslaagd zijn Direct beschikbaar na je betaling Online lezen of als PDF Verkeerd document? Gratis ruilen 4,6 TrustPilot
logo-home
Samenvatting

Samenvatting Introduction to the Practice of Statistics.

Beoordeling
-
Verkocht
5
Pagina's
9
Geüpload op
11-01-2015
Geschreven in
2014/2015

Deze samenvatting is weliswaar uit de 5e druk, maar het enige verschil met de nieuwe druk is dat de volgorde een beetje is gewisseld. De stof is gelijk gebleven, en ik heb met mijn samenvatting een 7.4 op het vak gehaald.

Instelling
Vak

Voorbeeld van de inhoud

Introduction to the Practice of Statistics

H1 Looking at Data
Introduction
Statistiek:
- vat kwantitatieve data samen
- geeft daarbij onnauwkeurigheidsmarges aan
- essentieel hulpmiddel bij onderzoek doen.
Data heeft een context nodig om het te begrijpen!

Als je een onderzoek begint:
- Waarom? Wat voor doel heeft de data?
- Wie? Welke en hoeveel individuelen beschrijft de data?
- Wat? Hoeveel variabelen bevat de data? Wat zijn de exacte definities hiervan? Meeteenheid?
Variabelen: kenmerken van een individu
- Categorische variabelen: in groepen of categorieën
- Kwantitatieve variabelen: nummers
Een verkeerde keuze van variabelen kan leiden tot vertekende conclusies (=misleidend)

1.1 Displaying Distributions with Graphs
Exploratory data analysis: het simpel beschrijven van wat we zien (m.b.v. statistische gereedschappen
en ideeën). Twee basisstrategieën:
- Begin met het onderzoeken van de variabelen en daarna een relatie daartussen zoeken
- Begin met grafiek(en). Voeg numerieke samenvattingen toe of specifieke aspecten van de data.
De verdeling van categorische variabelen geven het absolute aantal of het percentage aan.
Twee manieren van grafische verwerking (vaak gebruikt bij kwalitatieve data):
- Bar graph: staafdiagram. Flexibeler en makkelijker te lezen.
- Pie Chart: cirkeldiagram. Gebruik je als je alle categorieën wilt gebruiken om te kijken of er een
relatie is.

Belangrijke principes:
- Nadat je de achtergrond van de data weet  plot de data! Grafische verwerking!
- Als je naar je plot kijkt: kijk naar de globale verdeling en naar opvallende afwijkingen.

Kwantitatieve data analyseren:
- Stemplot: geeft een snel beeld van de verdeling en meteen ook de werkelijke getallen. Werkt het
best met cijfers boven 0.
> maken van een stemplot
- Elke observatie in een stengel.. Het laatste cijfer komt in een blad.
- Stengel wordt een verticale kolom met de kleinste bovenaan
- Maak de blaadjes.
> Bij 1 categorie: rechts van de stengel.
> Bij meerdere categorieën (bijv. man-vrouw): 1 links en 1 rechts. (=back-to-
back stemplot)
De blaadjes moeten vanaf de stengel naar buiten in oplopende volgorde zijn.
Stemplots werken niet goed bij een groot aantal data! Je zou dan bijvoorbeeld de stengels moeten
splitsen. Dus 1 stengel met blaadjes van 0-4 en een stengel met blaadjes van 5-9.
- Histogram
> beter bij groot aantal data.
> verdeelt data in klassen : vorm is hier heel erg afhankelijk van!

, > geeft niet alle werkelijke data.
> maken van een histogram:
- deel de data in klassen
- tel het aantal scores binnen deze klassen (frequentie)
- maak het histogram: x-as de klassenverdeling.
> je kunt ook frequentiehistogrammen maken: vergelijken van verschillende verdelingen.
> histogrammen hebben geen ruimte tussen de staven, staafdiagram wel.
Je kunt het patroon van een grafische verwerking beschrijven d.m.v. vorm, centrum en spreiding.
> gemiddelde = centrum: 50% links en 50% rechts.
> heeft het 1 of meerdere modus(sen)  1 = unimodaal
> Verdeling symmetrisch of scheef? (linksscheef/rechtsscheef)
> Let op „ouliers‟!
 foutje in de data? Verbeteren!
 afwijkende groep/persoon? Apart rapporteren!
Data verzameld over de tijd  Time plot!
> Trend: lange tijd dalen of stijgen.
> Seasonal variation: patroon dat zich herhaalt op bekende regelmatige tussenpozen van tijd.
 hierdoor vaak „seasonally adjusting‟ om misleiding te voorkomen. (aanpassen van
de grafieken)

1.2 Describing Distributions with Numbers
Centrummaten:
- Gemiddelde: niet resistent voor uitbijters!
- Mediaan: meer resistent voor uitbijters. Vergeet niet de getallen op volgorde te zetten!
> Verdeling symmetrisch? Gemiddelde = mediaan!
> Verdeling scheef? Gemiddelde is niet mediaan!
> Wanneer gemiddelde < mediaan? Bij linksscheve verdeling!
Spreidingsmaten:
- Kwartielen:
> Eerste kwartiel: de helft van de eerste helft. (mediaan van de getallen links v/d mediaan =
25%)
> Derde kwartiel: de helft van de tweede helft. (de mediaan van de getallen rechts v/d
mediaan = 75%)
- Afstand eerste en laatste kwartiel = middelste 50% = IQR.
 5 number summary en de bijbehorende grafische verwerking: boxplot (side by side = 2 boxplots)
- minimum
- Q1
- mediaan
- Q3
- maximum
Als een getal meer dan 1,5 x IQR van het minimum of maximum af ligt  outlier  apart weergeven.
- Gemiddelde absolute afwijking
- Variantie


- Standaarddeviatie
Wortel variantie. Standaardafwijking. Som van de afwijkingen van alle observaties is altijd 0!
Standaarddeviatie is groot als de spreiding vanaf het gemiddelde ook groot is.
> niet resistent voor outliers.

Wanneer centrum- of spreidingsmaten?  5 number summary voor een asymmetrische verdeling,

, voor symmetrische verdeling: gemiddelde en standaarddeviatie, variantie, gemiddelde absolute
afwijking, IQR.

Lineaire transformaties:
xnew=a+bx
x: scores van alle proefpersonen op variabele x
a: optelconstante
b: vermenigvuldigingsconstante
- effect op gemiddelde : x new  a  bx
- effect op standaardafwijking: s  b s
x new x



DIA 22 van College 4a voor transformaties!

1.3 Density Curves and Normal Distributions
Empirische cyclus:
> Vraagstelling  zorgvuldige formulering
> Operationalisatie:  hoe meet je het begrip/de variabelen van de vraagstelling?
> Onderzoeksopzet:  experiment/survey?
> Data verzamelen  het meeste werk
> Data screenen  plaatjes maken
> Data reductie/resultaten  samenvattingsmaten voor centrum en spreiding en complete
verdeling
> Onzekerheidsmarges

Dichtheidscurve
- geeft aan hoeveel van de scores is een willekeurig interval liggen
- = BENADERING
- altijd boven de x-as
- totale oppervlakte onder de curve is 1
- geen frequenties en geen y-as
- gladgestreken beeld van de verdeling van de scores
- dus ook maten voor centrum en spreiding. Gemiddelde: wanneer µ
Normale verdeling (=symmetrisch, unimodaal): en wanneer ?
- gemiddelde = mediaan = modus  steekproef
Waarom normale verdeling belangrijk? µ  hele populatie
- veel verdelingen zijn in de praktijk normaal
- kansprocessen  normaal verdeeld
- nuttig bij bepalen van onzekerheidsmarges
- je kunt er mee rekenen! 
> 68-95-99.7 regel:
- 68% binnen gem en daar een
standaarddeviatie vanaf
- 95% binnen gem en daar twee standaarddeviaties vanaf
- 99.7% binnen gemiddelde en 3 standaarddeviaties daar vanaf.
Weergave normale verdelingen : N(gemiddelde,standaarddeviatie)

Om mee te werken/vergelijken  standaardiseren:
- x is normaal verdeeld x
- x – gemiddelde is normaal verdeeld. Gemiddelde is 0 z

- Z is normaal verdeeld  standaard normale verdeling. Gemiddelde is 0 en standaardafw 1

Gekoppeld boek

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Heel boek samengevat?
Nee
Wat is er van het boek samengevat?
H1 tot en met h4
Geüpload op
11 januari 2015
Aantal pagina's
9
Geschreven in
2014/2015
Type
SAMENVATTING
$4.18
Krijg toegang tot het volledige document:

Verkeerd document? Gratis ruilen Binnen 14 dagen na aankoop en voor het downloaden kun je een ander document kiezen. Je kunt het bedrag gewoon opnieuw besteden.
Geschreven door studenten die geslaagd zijn
Direct beschikbaar na je betaling
Online lezen of als PDF

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
Araaanka Universiteit van Amsterdam
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
893
Lid sinds
11 jaar
Aantal volgers
303
Documenten
72
Laatst verkocht
2 maanden geleden

3.5

132 beoordelingen

5
15
4
70
3
25
2
15
1
7

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Bezig met je bronvermelding?

Maak nauwkeurige citaten in APA, MLA en Harvard met onze gratis bronnengenerator.

Bezig met je bronvermelding?

Veelgestelde vragen