Samenvatting Statistiek 2, 2e jr
bachelor psychologie
geschreven door:
sjorsvd
De Marktplaats voor het Kopen en Verkopen van je Samenvattingen
Op Stuvia vind je het grootste aanbod aan samenvattingen en collegeaantekeningen. De
documenten zijn geschreven door jouw medestudenten, specifiek voor jouw opleiding!
www.stuvia.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
, Stuvia.com - De Marktplaats voor het Kopen en Verkopen van je Samenvattingen
Statistiek II 2011-2012 Samenvatting cursus
Hoofdstuk 1: Basisbegrippen, beschrijvende statistiek en vectoralgebra
1.1: Onderzoek: verzamelen en analyseren van data
Methodologie: Bepalen hoe steekproef samen te stellen en welk onderzoeksdesign te gebruiken
Psychometrie: Bepalen hoe variabelen het best gemeten worden
Statistiek: Hoe waarschijnlijk is mijn onderzoeksvraag?
Data-analyse: Data analyseren met verschillende technieken om onderzoeksvraag te kunnen
beantwoorden
Data(set): verzameling van aantal variabelen gemeten bij een aantal elementen, meestal weergeven
in tabel (elementen in rij, variabelen in kolommen).
Variabelen hebben voor ieder element een bepaalde geobserveerde waarde, of score. Als de waarde
van een kenmerk voor alle elementen gelijk is, is het een constante. Variabelen komen voor op
verschillende meetniveaus:
Categorische variabelen: Nominaal: Slechts aanduiding
Ordinaal: Volgorde van belang
Continue variabelen: Interval: Meeteenheid, geen vast nulpunt
Ratio: Meeteenheid, vast nulpunt
Of een variabele continue of categorisch is, bepaalt welke analysetechnieken gebruikt kunnen
worden. Ook het aantal variabelen en de soort onderzoeksvraag spelen een rol.
Onderscheid:
Grote letter = Variabele
Kleine letter = Score v.e. element
Vette letter = Vector
1.2: Beschrijvende technieken: 1 variabele
Ordeningstechnieken: - Frequentietabel
- Relatieve frequentietabel: proporties (staafdiagram)
- Gegroepeerde frequentieverdeling: continue variabelen (histogram)
Reductietechnieken: - Modus: meest voorkomende score, vooral nominaal
- Mediaan: middelste score, vanaf ordinaal
- Gemiddelde: vanaf interval
̅ ∑
- Deviatiescores: ruwe score – gemiddelde ( ̇ ̅)
- Variatie: som van gekwadrateerde deviatiescores
∑ ̇
- Variantie: Variatie gedeeld door aantal elementen
∑ ̇
- Standaarddeviatie: Wortel van variantie (sx)
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
, Stuvia.com - De Marktplaats voor het Kopen en Verkopen van je Samenvattingen
Statistiek II 2011-2012 Samenvatting cursus
1.3: Beschrijvende technieken: 2 variabelen
Om een systematisch verband tussen twee variabelen te bepalen gebruikt met associatiematen.
Voor continue variabelen kan men gebruik maken van:
- Covariantie:
De som van het product van de deviatiescores van beide variabelen per element, gedeeld
door het aantal elementen. Hoe groter het getal (positief of negatief), hoe groter de
samenhang. Enkel vanaf intervalniveau, bepaalt enkel lineaire samenhang.
∑ ̅ ̅ ∑ ̇ ̇
- Correlatie:
Covariantie gedeeld door het product van de standaarddeviaties van de aparte variabelen.
Getal tussen –1 en +1, hoe verder van 0, hoe groter het verband.
Samenhang zegt niet over causaliteit.
1.4: Vectoralgebra
Een vector is een geordende reeks getallen. De getallen in een kolomvector (a) worden verticaal
weergeven, in een rijvector (a’) horizontaal. a’ staat voor de getransponeerde (gekeerde) van a.
Een scalair is een vector van orde 1 (één getal). De orde van een vector is het aantal elementen
(getallen) in de vector.
Optellen van twee vectoren kan alleen als beide vectoren van de zelfde orde zijn.
( )
Scalaire vermenigvuldiging heeft als resultaat een vector van dezelfde orde
( ) als a een kolomvector is.
Lineaire combinaties (v) zijn alleen mogelijk als iedere vector een eigen scalair heeft om mee te
vermenigvuldigen en het resultaat hiervan kan worden opgeteld.
Het scalair product is het product van een rij- en kolomvector. Dus als en
( ) dan ∑
Vectornotatie wordt in de statistiek veel gebruikt, omdat het een aantal praktische voordelen biedt.
Hoofdstuk 2: Toevalsvariabelen en kansverdeling
2.1: Toevalsvariabelen
Bij een toevalsproces is de uitkomst onvoorspelbaar. Een gebeurtenis is een deelverzameling van
mogelijke uitkomsten. Een zekere gebeurtenis (E) is de verzameling van alle mogelijke uitkomsten. Bij
een unie van twee gebeurtenissen ( ) gaat het om de elementen die in A en/of B voorkomen.
Bij een doorsnede van twee gebeurtenissen ( ) gaat het om de elementen die zowel in A als in B
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
, Stuvia.com - De Marktplaats voor het Kopen en Verkopen van je Samenvattingen
Statistiek II 2011-2012 Samenvatting cursus
voorkomen. De complementaire gebeurtenis van A is A* en komt alleen voor als A zich niet voordoet,
dus A* is alle mogelijke gebeurtenissen buiten A.
Een toevals- of kansvariabele (X) is een variabele waarvan de waarde in een toevalsproces
onvoorspelbaar is. In de praktijk zijn dit alle variabelen die men wenst te meten, waarvan men op
voorhand de waarde niet van kan voorspellen.
2.2: Kansen
Definitie kans: Relatieve frequentie van gebeurtenis (A) als we het toevalsproces oneindig zouden
herhalen. Dit is altijd een getal tussen 0 en 1. Notatie:
De kans op een unie van twee gebeurtenissen:
Een voorwaardelijke kans is de kans dat A zich voordoet op voorwaarde dat B zich voordoet, gegeven
dat de kans op B groter is dan 0. |
De kans op een doorsnede van twee gebeurtenissen: | |
Twee gebeurtenissen zijn afhankelijk als het voorkomen van de een de kans op de ander beïnvloed.
Is dit niet zo, dan zijn gebeurtenissen onafhankelijk en geldt dat: en
|
2.3: Kansverdelingen
Bij een discrete (of categorische) kansvariabele kan slecht een beperkt aantal waarden worden
aangenomen. Hierbij kan een kansverdeling (tabel) worden opgemaakt met per mogelijke waarde de
kans dat het voorkomt. In een cumulatieve frequentieverdeling wordt de kans weergeven dat de
waarde van een toevalsvariabele kleiner of gelijk is aan waarde x: ∑
Een continue kansvariabele kan een oneindig aantal waarden aannemen en heeft daarom geen
kansverdeling, maar een kansdichtheidsfunctie. Hierbij wordt de kans berekend dat x tussen
bepaalde waarden ligt. ∫
2.4: Verwachting en variantie
Bij een toevalsvariabele wordt het gemiddelde de verwachting genoemd, E(X).
Voor een discrete kansvariabele: ∑ , oftewel de som van de mogelijke waarden maal
de kans op die waarden.
Voor een continue kansvariabele: ∫
De mate van spreiding binnen een kansvariabele is de variantie:
Zie cursus p. 26-27 en 36-37 voor enkele eigenschappen. Deze zijn al besproken in psychometrie.
2.5: Bijzondere discrete verdelingen
Bernoulli verdeling: Experiment met 1 trial en twee mogelijke uitkomsten (succes/geen succes)
Notatie: X ~ B(π), met π de kans op succes
f(x) = π (bij succes) of f(x) = 1 – π (bij geen succes)
E(X) = π
Var(X) = π(1-π)
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
bachelor psychologie
geschreven door:
sjorsvd
De Marktplaats voor het Kopen en Verkopen van je Samenvattingen
Op Stuvia vind je het grootste aanbod aan samenvattingen en collegeaantekeningen. De
documenten zijn geschreven door jouw medestudenten, specifiek voor jouw opleiding!
www.stuvia.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
, Stuvia.com - De Marktplaats voor het Kopen en Verkopen van je Samenvattingen
Statistiek II 2011-2012 Samenvatting cursus
Hoofdstuk 1: Basisbegrippen, beschrijvende statistiek en vectoralgebra
1.1: Onderzoek: verzamelen en analyseren van data
Methodologie: Bepalen hoe steekproef samen te stellen en welk onderzoeksdesign te gebruiken
Psychometrie: Bepalen hoe variabelen het best gemeten worden
Statistiek: Hoe waarschijnlijk is mijn onderzoeksvraag?
Data-analyse: Data analyseren met verschillende technieken om onderzoeksvraag te kunnen
beantwoorden
Data(set): verzameling van aantal variabelen gemeten bij een aantal elementen, meestal weergeven
in tabel (elementen in rij, variabelen in kolommen).
Variabelen hebben voor ieder element een bepaalde geobserveerde waarde, of score. Als de waarde
van een kenmerk voor alle elementen gelijk is, is het een constante. Variabelen komen voor op
verschillende meetniveaus:
Categorische variabelen: Nominaal: Slechts aanduiding
Ordinaal: Volgorde van belang
Continue variabelen: Interval: Meeteenheid, geen vast nulpunt
Ratio: Meeteenheid, vast nulpunt
Of een variabele continue of categorisch is, bepaalt welke analysetechnieken gebruikt kunnen
worden. Ook het aantal variabelen en de soort onderzoeksvraag spelen een rol.
Onderscheid:
Grote letter = Variabele
Kleine letter = Score v.e. element
Vette letter = Vector
1.2: Beschrijvende technieken: 1 variabele
Ordeningstechnieken: - Frequentietabel
- Relatieve frequentietabel: proporties (staafdiagram)
- Gegroepeerde frequentieverdeling: continue variabelen (histogram)
Reductietechnieken: - Modus: meest voorkomende score, vooral nominaal
- Mediaan: middelste score, vanaf ordinaal
- Gemiddelde: vanaf interval
̅ ∑
- Deviatiescores: ruwe score – gemiddelde ( ̇ ̅)
- Variatie: som van gekwadrateerde deviatiescores
∑ ̇
- Variantie: Variatie gedeeld door aantal elementen
∑ ̇
- Standaarddeviatie: Wortel van variantie (sx)
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
, Stuvia.com - De Marktplaats voor het Kopen en Verkopen van je Samenvattingen
Statistiek II 2011-2012 Samenvatting cursus
1.3: Beschrijvende technieken: 2 variabelen
Om een systematisch verband tussen twee variabelen te bepalen gebruikt met associatiematen.
Voor continue variabelen kan men gebruik maken van:
- Covariantie:
De som van het product van de deviatiescores van beide variabelen per element, gedeeld
door het aantal elementen. Hoe groter het getal (positief of negatief), hoe groter de
samenhang. Enkel vanaf intervalniveau, bepaalt enkel lineaire samenhang.
∑ ̅ ̅ ∑ ̇ ̇
- Correlatie:
Covariantie gedeeld door het product van de standaarddeviaties van de aparte variabelen.
Getal tussen –1 en +1, hoe verder van 0, hoe groter het verband.
Samenhang zegt niet over causaliteit.
1.4: Vectoralgebra
Een vector is een geordende reeks getallen. De getallen in een kolomvector (a) worden verticaal
weergeven, in een rijvector (a’) horizontaal. a’ staat voor de getransponeerde (gekeerde) van a.
Een scalair is een vector van orde 1 (één getal). De orde van een vector is het aantal elementen
(getallen) in de vector.
Optellen van twee vectoren kan alleen als beide vectoren van de zelfde orde zijn.
( )
Scalaire vermenigvuldiging heeft als resultaat een vector van dezelfde orde
( ) als a een kolomvector is.
Lineaire combinaties (v) zijn alleen mogelijk als iedere vector een eigen scalair heeft om mee te
vermenigvuldigen en het resultaat hiervan kan worden opgeteld.
Het scalair product is het product van een rij- en kolomvector. Dus als en
( ) dan ∑
Vectornotatie wordt in de statistiek veel gebruikt, omdat het een aantal praktische voordelen biedt.
Hoofdstuk 2: Toevalsvariabelen en kansverdeling
2.1: Toevalsvariabelen
Bij een toevalsproces is de uitkomst onvoorspelbaar. Een gebeurtenis is een deelverzameling van
mogelijke uitkomsten. Een zekere gebeurtenis (E) is de verzameling van alle mogelijke uitkomsten. Bij
een unie van twee gebeurtenissen ( ) gaat het om de elementen die in A en/of B voorkomen.
Bij een doorsnede van twee gebeurtenissen ( ) gaat het om de elementen die zowel in A als in B
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.
, Stuvia.com - De Marktplaats voor het Kopen en Verkopen van je Samenvattingen
Statistiek II 2011-2012 Samenvatting cursus
voorkomen. De complementaire gebeurtenis van A is A* en komt alleen voor als A zich niet voordoet,
dus A* is alle mogelijke gebeurtenissen buiten A.
Een toevals- of kansvariabele (X) is een variabele waarvan de waarde in een toevalsproces
onvoorspelbaar is. In de praktijk zijn dit alle variabelen die men wenst te meten, waarvan men op
voorhand de waarde niet van kan voorspellen.
2.2: Kansen
Definitie kans: Relatieve frequentie van gebeurtenis (A) als we het toevalsproces oneindig zouden
herhalen. Dit is altijd een getal tussen 0 en 1. Notatie:
De kans op een unie van twee gebeurtenissen:
Een voorwaardelijke kans is de kans dat A zich voordoet op voorwaarde dat B zich voordoet, gegeven
dat de kans op B groter is dan 0. |
De kans op een doorsnede van twee gebeurtenissen: | |
Twee gebeurtenissen zijn afhankelijk als het voorkomen van de een de kans op de ander beïnvloed.
Is dit niet zo, dan zijn gebeurtenissen onafhankelijk en geldt dat: en
|
2.3: Kansverdelingen
Bij een discrete (of categorische) kansvariabele kan slecht een beperkt aantal waarden worden
aangenomen. Hierbij kan een kansverdeling (tabel) worden opgemaakt met per mogelijke waarde de
kans dat het voorkomt. In een cumulatieve frequentieverdeling wordt de kans weergeven dat de
waarde van een toevalsvariabele kleiner of gelijk is aan waarde x: ∑
Een continue kansvariabele kan een oneindig aantal waarden aannemen en heeft daarom geen
kansverdeling, maar een kansdichtheidsfunctie. Hierbij wordt de kans berekend dat x tussen
bepaalde waarden ligt. ∫
2.4: Verwachting en variantie
Bij een toevalsvariabele wordt het gemiddelde de verwachting genoemd, E(X).
Voor een discrete kansvariabele: ∑ , oftewel de som van de mogelijke waarden maal
de kans op die waarden.
Voor een continue kansvariabele: ∫
De mate van spreiding binnen een kansvariabele is de variantie:
Zie cursus p. 26-27 en 36-37 voor enkele eigenschappen. Deze zijn al besproken in psychometrie.
2.5: Bijzondere discrete verdelingen
Bernoulli verdeling: Experiment met 1 trial en twee mogelijke uitkomsten (succes/geen succes)
Notatie: X ~ B(π), met π de kans op succes
f(x) = π (bij succes) of f(x) = 1 – π (bij geen succes)
E(X) = π
Var(X) = π(1-π)
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document is strafbaar.