Introduction to the Practice of Statistics
D.S. Moore, G.P. McCabe and B.A. Craig
Courses:
- OP1
- OP2
Note:
Verdelingen worden ook distributies genoemd in de SV
Inhoudsopgave
Chapter 1. Kijken naar gegevensdistributie..................................................................................................... 2
1.1. Data...............................................................................................................................................................2
1.2. Weergave van verdelingen met grafieken....................................................................................................4
1.3. Het beschrijven van verdelingen met getallen..............................................................................................8
1.4. Dichtheidscurves en normale verdeling......................................................................................................12
Chapter 2..................................................................................................................................................... 17
2.1. Relaties........................................................................................................................................................18
2.2. Spreidingsdiagrammen...............................................................................................................................19
2.3. Correlatie....................................................................................................................................................20
2.4. Kleinste kwadraten regessie........................................................................................................................22
2.5. Voorzichtigheid met betrekking tot correlatie en regressie........................................................................24
2.6. *nog invullen...............................................................................................................................................28
2.7. De vraag naar de oorzaak...........................................................................................................................28
Chapter 3..................................................................................................................................................... 29
3.1. –...................................................................................................................................................................29
3.2. Het ontwerpen van experimenten..............................................................................................................30
3.3. Steekproefontwerpen..................................................................................................................................33
3.4. Ethiek...........................................................................................................................................................33
Chapter 4..................................................................................................................................................... 35
4.1. Randomiseren.............................................................................................................................................35
Chapter 5. steekproef distributie.................................................................................................................. 36
5.1. Naar statistische inferentie.........................................................................................................................36
5.2. De steekproef distributie van een steekproef gemiddelde.........................................................................36
Chapter 6..................................................................................................................................................... 36
6.1.......................................................................................................................................................................36
Chapter 7..................................................................................................................................................... 36
7.1. Inferentie van het gemiddelde van de populatie........................................................................................37
7.2. Vergelijken van 2 gemiddelden...................................................................................................................41
1
,Chapter 8..................................................................................................................................................... 45
Chapter 9..................................................................................................................................................... 45
Chapter 10. Inferentie voor regressie........................................................................................................... 45
10.1. Simpele lineaire regressie..........................................................................................................................45
10.2. Meer details over simpele lineaire regressie.............................................................................................55
Chapter 11. Meervoudige regressie.............................................................................................................. 63
11.1. Inferentie voor meervoudige regressie.....................................................................................................63
11.2. Een casus study.........................................................................................................................................69
Chapter 12. Een zijdig analyse van de variantie.............................................................................................74
12.1. inferentie voor een zijdig analyses van de variantie.................................................................................74
12.2. Vergelijken van gemiddelden....................................................................................................................84
Chapter 13. two-way analyse van de variantie..............................................................................................87
13.1. De two-way Anova model.........................................................................................................................88
13.2. inferentie voor de two-way Anova............................................................................................................93
Online Chapter 14........................................................................................................................................ 95
Online Chapter 15. Niet parametische testen............................................................................................... 96
15.1. De Wilcoxon rank som test........................................................................................................................97
15.2. De Wilcoxon Signed rank test.................................................................................................................101
15.3. De The Kruskal-Wallis Test......................................................................................................................103
Online Chapter 16...................................................................................................................................... 105
Online Chapter 17...................................................................................................................................... 105
OP1/2: 1.1 & 1.2
OP1/3: 1.3
OP1/5: 1.4
OP1/6: 2.1-2.5
OP2, HC1: MMC 7.1 p. 383-398, 7.2 p. 410-420 (done)
OP2, HC2: MMC H12 p. 598-618 en 630-635 (done)
OP2, HC3: MMC H15 (zie BS)
OP2, HC4: MMC H13
OP2, HC5: MMC H10&11
Chapter 1. Kijken naar gegevensdistributie
1.1. Data
(opdrachten maken als oefening)
2
,Wat ik na deze paragraaf weet
Voorbeelden geven van zaak in een dataverzameling
Identificeren van variabelen in een dataverzameling en wanneer een variabelen
gebruikt kan worden als een label
Identificeren van de waarde van een variabelen en het classificeren van een
variabelen op categorie of kwantitatief
Beschrijven van hoofd karakters van een dataverzameling
Een statistische analyse start bij een dataverzameling. Het construeren van data begint bij
het bepalen wat voor zaken we gaan bestuderen. Voor elke zaak doen we informatie
verzamelen over de karakteristieken en dat noemen we een variabelen.
Cases/zaken: zijn de objecten die beschreven worden in een dataset. (je kan het ook
wel zien als een aantal deelnemers)
Variabelen: zijn de karakteristieken van een zaak. (je moet het zien als de
verzamelnaam van een rij of kolom)
Verschillende zaken kunnen verschillende waarde per variabelen hebben. (zie het als
de inhoud onder de verzamelnaam)
Label: is een speciale variabelen die gebruikt wordt in sommige dataverzamelingen
om unieke verschillende zaken te identificeren. (denk aan je schoolnummer)
VB: cryptomunt, Initial Coin Offerings (ICO)
1A, B, C etc: zijn de variabelen
Vanaf 2: zijn alles cases
Kolom A: is rangschikken
Kolom B: is naam ICO/organisatie
Kolom C: de plaatsen waar de cryptomunt is gestart
Kolom D: de waarde hoeveel het heeft oplevert
Categorie variabelen: plaatst een zaak in 1 van meerdere groepen of categorieën.
Kwantiteit variabelen: neemt numerieke waarde waarvoor rekenkundige
bewerkingen, zoals optellen en middelen, zinvol zijn. (zie VB. cryptomunt. Er zijn 4
variabelen, waarvan Amount kwantiteit variabelen zijn)
3
, Observatie: gebruiken we om de data te beschrijven van een specifieke zaak
Spreadsheet: de display die we zien in VB cryptomunt.
Note: spaties zijn niet de bedoeling, gebruik _
Meeteenheid: denk hierbij aan het meten van iemands lengte, d.m.v. inch of cm. Dit
is tevens een kwantitatieve variabelen.
Belangrijke karakters van een dataverzameling
1. Wie? Welke zaken worden erin met de data beschreven? Hoeveel zaken de
dataverzameling bevat?
2. Wat? Uit hoeveel variabelen bestaat het? Wat is de definitie van de variabelen?
Welke maateenheid wordt er gebruikt?
3. Waarom? Wat is het doel van data? Willen we vragen beantwoorden? Willen we
conclusies trekken?
Instrumenten: variabelen worden gemeten met een instrument. (denk aan het
meten van de maten van zuurstof in de lucht)
Rate/percentage/beoordeling: het percentage/ de beoordeling waarmee iets
gebeurt is een zinvollere maatstaf dan een eenvoudige telling van het aantal keren
dat iets voorkomt (denk aan een slagingspercentage of beoordeling van een school)
het beoordelen van een percentage is een van de manieren om de ene variabele
aanpassen om een andere te creëren.
1.2. Weergave van verdelingen met grafieken
(opdrachten maken als oefening)
Verdelingen: de verdeling van variabelen beschrijven hoe de waarde van een
variabelen varieert van zaak tot zaak.
Verkennende gegevensanalyse: de statistische middelen en ideeën helpen bij het
bekijken van data om de grootste kenmerken te beschrijven. Dit noemen we
verkennende gegevensanalyse.
o Je begint bij het examineren van elke variabelen zelf. En vervolgens ga je de
relatie tussen de variabelen bestuderen.
o Je begint bij de grafiek(en). Vervolgens voeg je een numerieke samenvatting
toe van een bepaald aspect van de data.
Voorspellende analyse: op het moment dat we verkennend onderzoek doen is de
focus naar het beschrijven van de waarde van de variabelen in de dataverzameling.
Bij voorspellende analyse staat het gebruiken en voorspellen voor de toekomst
centraal. (vb. denk aan het openen van een nieuwe vestiging, waar gaat een nieuwe
locatie het meeste opleveren)
Categorische variabelen: staafdiagrammen en cirkeldiagrammen
Verdeling van een categorische variabelen: zet de variabelen in een lijst
Telling: hierop kan een lijst gebaseerd zijn
Procent: hierop kan een lijst gebaseerd zijn
4
D.S. Moore, G.P. McCabe and B.A. Craig
Courses:
- OP1
- OP2
Note:
Verdelingen worden ook distributies genoemd in de SV
Inhoudsopgave
Chapter 1. Kijken naar gegevensdistributie..................................................................................................... 2
1.1. Data...............................................................................................................................................................2
1.2. Weergave van verdelingen met grafieken....................................................................................................4
1.3. Het beschrijven van verdelingen met getallen..............................................................................................8
1.4. Dichtheidscurves en normale verdeling......................................................................................................12
Chapter 2..................................................................................................................................................... 17
2.1. Relaties........................................................................................................................................................18
2.2. Spreidingsdiagrammen...............................................................................................................................19
2.3. Correlatie....................................................................................................................................................20
2.4. Kleinste kwadraten regessie........................................................................................................................22
2.5. Voorzichtigheid met betrekking tot correlatie en regressie........................................................................24
2.6. *nog invullen...............................................................................................................................................28
2.7. De vraag naar de oorzaak...........................................................................................................................28
Chapter 3..................................................................................................................................................... 29
3.1. –...................................................................................................................................................................29
3.2. Het ontwerpen van experimenten..............................................................................................................30
3.3. Steekproefontwerpen..................................................................................................................................33
3.4. Ethiek...........................................................................................................................................................33
Chapter 4..................................................................................................................................................... 35
4.1. Randomiseren.............................................................................................................................................35
Chapter 5. steekproef distributie.................................................................................................................. 36
5.1. Naar statistische inferentie.........................................................................................................................36
5.2. De steekproef distributie van een steekproef gemiddelde.........................................................................36
Chapter 6..................................................................................................................................................... 36
6.1.......................................................................................................................................................................36
Chapter 7..................................................................................................................................................... 36
7.1. Inferentie van het gemiddelde van de populatie........................................................................................37
7.2. Vergelijken van 2 gemiddelden...................................................................................................................41
1
,Chapter 8..................................................................................................................................................... 45
Chapter 9..................................................................................................................................................... 45
Chapter 10. Inferentie voor regressie........................................................................................................... 45
10.1. Simpele lineaire regressie..........................................................................................................................45
10.2. Meer details over simpele lineaire regressie.............................................................................................55
Chapter 11. Meervoudige regressie.............................................................................................................. 63
11.1. Inferentie voor meervoudige regressie.....................................................................................................63
11.2. Een casus study.........................................................................................................................................69
Chapter 12. Een zijdig analyse van de variantie.............................................................................................74
12.1. inferentie voor een zijdig analyses van de variantie.................................................................................74
12.2. Vergelijken van gemiddelden....................................................................................................................84
Chapter 13. two-way analyse van de variantie..............................................................................................87
13.1. De two-way Anova model.........................................................................................................................88
13.2. inferentie voor de two-way Anova............................................................................................................93
Online Chapter 14........................................................................................................................................ 95
Online Chapter 15. Niet parametische testen............................................................................................... 96
15.1. De Wilcoxon rank som test........................................................................................................................97
15.2. De Wilcoxon Signed rank test.................................................................................................................101
15.3. De The Kruskal-Wallis Test......................................................................................................................103
Online Chapter 16...................................................................................................................................... 105
Online Chapter 17...................................................................................................................................... 105
OP1/2: 1.1 & 1.2
OP1/3: 1.3
OP1/5: 1.4
OP1/6: 2.1-2.5
OP2, HC1: MMC 7.1 p. 383-398, 7.2 p. 410-420 (done)
OP2, HC2: MMC H12 p. 598-618 en 630-635 (done)
OP2, HC3: MMC H15 (zie BS)
OP2, HC4: MMC H13
OP2, HC5: MMC H10&11
Chapter 1. Kijken naar gegevensdistributie
1.1. Data
(opdrachten maken als oefening)
2
,Wat ik na deze paragraaf weet
Voorbeelden geven van zaak in een dataverzameling
Identificeren van variabelen in een dataverzameling en wanneer een variabelen
gebruikt kan worden als een label
Identificeren van de waarde van een variabelen en het classificeren van een
variabelen op categorie of kwantitatief
Beschrijven van hoofd karakters van een dataverzameling
Een statistische analyse start bij een dataverzameling. Het construeren van data begint bij
het bepalen wat voor zaken we gaan bestuderen. Voor elke zaak doen we informatie
verzamelen over de karakteristieken en dat noemen we een variabelen.
Cases/zaken: zijn de objecten die beschreven worden in een dataset. (je kan het ook
wel zien als een aantal deelnemers)
Variabelen: zijn de karakteristieken van een zaak. (je moet het zien als de
verzamelnaam van een rij of kolom)
Verschillende zaken kunnen verschillende waarde per variabelen hebben. (zie het als
de inhoud onder de verzamelnaam)
Label: is een speciale variabelen die gebruikt wordt in sommige dataverzamelingen
om unieke verschillende zaken te identificeren. (denk aan je schoolnummer)
VB: cryptomunt, Initial Coin Offerings (ICO)
1A, B, C etc: zijn de variabelen
Vanaf 2: zijn alles cases
Kolom A: is rangschikken
Kolom B: is naam ICO/organisatie
Kolom C: de plaatsen waar de cryptomunt is gestart
Kolom D: de waarde hoeveel het heeft oplevert
Categorie variabelen: plaatst een zaak in 1 van meerdere groepen of categorieën.
Kwantiteit variabelen: neemt numerieke waarde waarvoor rekenkundige
bewerkingen, zoals optellen en middelen, zinvol zijn. (zie VB. cryptomunt. Er zijn 4
variabelen, waarvan Amount kwantiteit variabelen zijn)
3
, Observatie: gebruiken we om de data te beschrijven van een specifieke zaak
Spreadsheet: de display die we zien in VB cryptomunt.
Note: spaties zijn niet de bedoeling, gebruik _
Meeteenheid: denk hierbij aan het meten van iemands lengte, d.m.v. inch of cm. Dit
is tevens een kwantitatieve variabelen.
Belangrijke karakters van een dataverzameling
1. Wie? Welke zaken worden erin met de data beschreven? Hoeveel zaken de
dataverzameling bevat?
2. Wat? Uit hoeveel variabelen bestaat het? Wat is de definitie van de variabelen?
Welke maateenheid wordt er gebruikt?
3. Waarom? Wat is het doel van data? Willen we vragen beantwoorden? Willen we
conclusies trekken?
Instrumenten: variabelen worden gemeten met een instrument. (denk aan het
meten van de maten van zuurstof in de lucht)
Rate/percentage/beoordeling: het percentage/ de beoordeling waarmee iets
gebeurt is een zinvollere maatstaf dan een eenvoudige telling van het aantal keren
dat iets voorkomt (denk aan een slagingspercentage of beoordeling van een school)
het beoordelen van een percentage is een van de manieren om de ene variabele
aanpassen om een andere te creëren.
1.2. Weergave van verdelingen met grafieken
(opdrachten maken als oefening)
Verdelingen: de verdeling van variabelen beschrijven hoe de waarde van een
variabelen varieert van zaak tot zaak.
Verkennende gegevensanalyse: de statistische middelen en ideeën helpen bij het
bekijken van data om de grootste kenmerken te beschrijven. Dit noemen we
verkennende gegevensanalyse.
o Je begint bij het examineren van elke variabelen zelf. En vervolgens ga je de
relatie tussen de variabelen bestuderen.
o Je begint bij de grafiek(en). Vervolgens voeg je een numerieke samenvatting
toe van een bepaald aspect van de data.
Voorspellende analyse: op het moment dat we verkennend onderzoek doen is de
focus naar het beschrijven van de waarde van de variabelen in de dataverzameling.
Bij voorspellende analyse staat het gebruiken en voorspellen voor de toekomst
centraal. (vb. denk aan het openen van een nieuwe vestiging, waar gaat een nieuwe
locatie het meeste opleveren)
Categorische variabelen: staafdiagrammen en cirkeldiagrammen
Verdeling van een categorische variabelen: zet de variabelen in een lijst
Telling: hierop kan een lijst gebaseerd zijn
Procent: hierop kan een lijst gebaseerd zijn
4