Inleiding tot statistisch redeneren – Hoorcollege 1
Empirische Cyclus
Video – Empirische cyclus
Het kenmerkt de hypothetische deductieve benadering van de wetenschap.
1. Observatie
= observatie zorgt voor idee voor nieuw onderzoek.
Bv. Zien patroon, onverwachte gebeurtenis, iets wat we interessant vinden en uit willen
leggen. Hoe de observatie gebeurd maakt niet uit! (al is het in je fantasie)
2. Inductie
= Algemene regel vanuit de observatie
3. Deductie
= Algemene regel moet volstaan in andere omstandigheden. Verwachting of voorspelling voor
nieuwe observaties. Ook onderzoekssetup duidelijk maken --> definities, operationalisaties
4. Toetsen
= Hypothese wordt getoetst door verzamelen nieuwe data en ze vergelijken met de
verwachting. Vaak statistisch --> beschrijvende statistiek om statistieken te samenvatten &
inferentiële statistiek om beslissen of verwachting juist was.
Verwachting juist of niet juist in deze fase!
5. Evaluatie
= Interpreteren resultaat van Toetsen. Je kan STEUN vinden voor hypothese, maar nooit
definitief bewijzen!! (kan altijd in toekomst veranderen)
Steunen, aanpassen of verwerpen van Hypothese.
Voorbeeld uit video:
Observatie: ik heb vreselijke schoonmoeder & mijn vriendinnen klagen ook over hun schoonmoeder.
Vind ik een interessant patroon tussen type persoon & leuk vinden.
Inductie: alle schoonmoeders zijn vreselijk. (hoeft niet waar te zijn, deze hypothese ga je testen!!)
,Deductie: Als alle schoonmoeders echt vreselijk zijn en ik vraag 10 collega’s om hun schoonmoeder
te raten (1. Leuk 2. neutraal 3. vreselijk --> Operationalisatie) Moeten ze allemaal vreselijk kiezen.
Toetsen: 2 zeggen neutraal. Dus verwachting niet waar.
Beslissingscriteria: Als er ook maar 1 iemand geen hekel heeft aan schoonmoeder --> verwerp H0
Evaluatie: Miss ook andere manier van onderzoek beter geweest. Hypothese steunen, aanpassen of
verwerpen.
Anders doen dan Annemarie in video:
Andere operationalisatie dan die 3 categorieën, bv.:
- Meer categorieën
- Mate van hekel aan schoonmoeder (Likertschaal)
Andere beslissingscriteria: bv. Gemiddelde nemen van meningen
--> passende statistische toets: gemiddelde, 1 waarde waartegen je wilt toetsen = one sample t-toets
Experiment in het hoorcollege
10 gooien & kijken hoe vaak die op kop valt.
Verwachting: 5 x (als muntje helemaal in goede staat is)
Maar hoe weet je dat muntje in goede staat is?:
--> Muntje van docent is geslagen dus weet niet of die in balans is. Muntjes van leerlingen wel in
balans (= H0). Dus allemaal 10x gooien.
Uitkomst:
Muntje docent --> 2x kop & 8x munt
(Teken je dit in tabelletje = steekproefverdeling)
Wilt weten --> Wat is de steekproevenverdeling?
Steekproevenverdeling maken:
Alle steekproeven van leerlingen in SPSS zetten.
Excel bestand in SPSS krijgen:
1. Download bestand
2. Naar bestanden in SPSS
3. “Import Data”
4. "CSV Data”
5. In "downloads”
6. Kijk naar “first line contains variable names” --> wil je deze aanvinken of niet? (vaak wel)
7. Delimiter controleren of dat klopt
8. (Probleem er staat achter de cijfers E+000 --> wat dan doen?:
Als je er dubbel opklikt zie je wel dat juiste cijfertje erachter staat. Alleen weergave klopt niet,
Dan --> variable view --> "type” aanpassen van "scientific” naar “numeric”)
9. Check in Variable view ook of “measures” klopt
Meetvariabele hiervan is --> ordinaal
Belangrijk voor doen analyse
- Doorloop variable view of alles klopt.
- Doorloop alle antwoorden --> kloppen die?
Hoe voorkomen dat je gekke antwoorden krijgt?
--> in qualtrics zetten dat bv. Alleen antwoord cijfer kan zijn van 0 t/m 10.
,Opruimen van gekke antwoorden
Stel vast wat je wel wilt zien. = Select Cases
Bijvoorbeeld: alle cijfers van 0 t/m 10
- Ga naar “data”
- Ga naar “select cases”
- Vul dan bij dit vb. In: variabele > = 0 & variabele < = 10
- “Paste”
Verder met de steekproeven
Willen grafiek van maken, doe je met --> Chart Builder
Grafiek die bij dit vb. Nodig is = Bar
Op x-as --> 0 t/m 10 kop
Op y-as --> frequentie gooien 0 t/m 10 kop
Wat houdt de tabel in?
Deze tabel geeft weer --> SteekproeVENverdeling
Deze tabel = GEEN Normale Verdeling = discrete kansverdeling --> biominaal (want --> er zijn
afzonderlijke categorieën DUS is het NIET continu. Kan niet 3,6 hebben bv.)
Conclusie
Docent 2x kop.
Tabel laat zien leerlingen vooral 4,5,6x kop. Maar leerlingen heeft wel ook 2.
Dus docent niet overduidelijk niet gezond.
Kan niet met zekerheid zeggen dat docent munt zuiver is.
Soorten Distributies/Verdelingen
1. Population distribution = Populatieverdeling
2. Sample distribution = Steekproefverdeling
3. Sampling distribution = Steekproevenverdeling
H1 – Steekproevenverdeling - Boek
Hoe anders had mijn steekproef kunnen zijn?
Sleutelwoorden
inferentiële statistiek, generalisatie, populatie, aselecte steekproef, steekproefstatistiek,
steekproefruimte, toevalsvariabele, steekproevenverdeling, kans, kansverdeling, discrete
kansverdeling, verwachtingswaarde/expectatie, zuivere schatter, parameter, (neerwaarts) vertekend,
, representatieve steekproef, continue variabele, continue kansverdeling, kansdichtheid, (linker/rechter)
kans.
Overzichtsvideo
Begrippen
Steekproef statistiek = Nummer beschrijft kenmerk van een steekproef
Steekproefgrootheid = waar je naar geïnteresseerd bent in je steekproef.
= kansvariabele
Proportie = deel / geheel
Steekproef ruimte = alle mogelijke waarden van steekproefgrootheid. Deze kun je vinden. Op
horizontale as.
Populatieverdeling = verdeling van hele populatie (heb je vaak niet). Op verticale as staat de
steekproefgrootheid.
Steekproefverdeling = overzicht van wat je kan aantreffen als je een steekproef trekt & hoe groot is de
kans op die uitkomst. Op verticale as staat de steekproefgrootheid.
Steekproevenverdeling = Alle mogelijke waarden van een steekproefstatistiek en hun kansen of
kansdichtheden. Op verticale as staan steekproeven.
Kansdichtheid = Een manier om de kans te bepalen dat een continue toevalsvariabele (zoals gewicht)
binnen een bepaald interval valt.
--> kans bij continue variabelen. Je kijkt hier naar reeks uitkomsten.
Bij continue toevalsvariabelen gebruik je geen kans op één specifieke waarde (zoals bij discrete
variabelen), want de kans dat een continue variabele exact één waarde aanneemt is nul. In plaats
daarvan werk je met een kansdichtheidsfunctie (pdf: probability density function).
Verwachtingswaarde/expectatie = Het gemiddelde van een kansverdeling, zoals een
steekproevenverdeling.
Zuivere schatter = Een steekproefstatistiek waarvoor de verwachtingswaarde gelijk is aan de
populatiewaarde.
--> Linkje tussen populatie & steekproevenverdeling mag je alleen leggen als je zuivere schatter hebt!
(in deze cursus altijd zuivere schatter) Linkje = verwachte waarde moet in beide hetzelfde zijn
Steekproevenverdeling
Steekproevenverdeling = cruciale link tussen de populatie & de steekproef die uit de populatie is
getrokken.
ZONDER --> niet generaliseren van steekproef naar de populatie
1000’en steekproeven nodig voor krijgen --> steekproevenverdeling!
Expected value = gemiddelde van steekproevenverdeling
True population value = gemiddelde van de steekproevenverdeling
Beperkingen steekproevenverdeling:
- Steekproef moet random zijn
- Onbevooroordeelde estimator/schatter
- Continu versus discreet --> waarschijnlijkheidsdichtheid versus waarschijnlijkheden
- Onpraktisch (1000’en steekproeven nodig) (vooral bij survey & experiment)
Empirische Cyclus
Video – Empirische cyclus
Het kenmerkt de hypothetische deductieve benadering van de wetenschap.
1. Observatie
= observatie zorgt voor idee voor nieuw onderzoek.
Bv. Zien patroon, onverwachte gebeurtenis, iets wat we interessant vinden en uit willen
leggen. Hoe de observatie gebeurd maakt niet uit! (al is het in je fantasie)
2. Inductie
= Algemene regel vanuit de observatie
3. Deductie
= Algemene regel moet volstaan in andere omstandigheden. Verwachting of voorspelling voor
nieuwe observaties. Ook onderzoekssetup duidelijk maken --> definities, operationalisaties
4. Toetsen
= Hypothese wordt getoetst door verzamelen nieuwe data en ze vergelijken met de
verwachting. Vaak statistisch --> beschrijvende statistiek om statistieken te samenvatten &
inferentiële statistiek om beslissen of verwachting juist was.
Verwachting juist of niet juist in deze fase!
5. Evaluatie
= Interpreteren resultaat van Toetsen. Je kan STEUN vinden voor hypothese, maar nooit
definitief bewijzen!! (kan altijd in toekomst veranderen)
Steunen, aanpassen of verwerpen van Hypothese.
Voorbeeld uit video:
Observatie: ik heb vreselijke schoonmoeder & mijn vriendinnen klagen ook over hun schoonmoeder.
Vind ik een interessant patroon tussen type persoon & leuk vinden.
Inductie: alle schoonmoeders zijn vreselijk. (hoeft niet waar te zijn, deze hypothese ga je testen!!)
,Deductie: Als alle schoonmoeders echt vreselijk zijn en ik vraag 10 collega’s om hun schoonmoeder
te raten (1. Leuk 2. neutraal 3. vreselijk --> Operationalisatie) Moeten ze allemaal vreselijk kiezen.
Toetsen: 2 zeggen neutraal. Dus verwachting niet waar.
Beslissingscriteria: Als er ook maar 1 iemand geen hekel heeft aan schoonmoeder --> verwerp H0
Evaluatie: Miss ook andere manier van onderzoek beter geweest. Hypothese steunen, aanpassen of
verwerpen.
Anders doen dan Annemarie in video:
Andere operationalisatie dan die 3 categorieën, bv.:
- Meer categorieën
- Mate van hekel aan schoonmoeder (Likertschaal)
Andere beslissingscriteria: bv. Gemiddelde nemen van meningen
--> passende statistische toets: gemiddelde, 1 waarde waartegen je wilt toetsen = one sample t-toets
Experiment in het hoorcollege
10 gooien & kijken hoe vaak die op kop valt.
Verwachting: 5 x (als muntje helemaal in goede staat is)
Maar hoe weet je dat muntje in goede staat is?:
--> Muntje van docent is geslagen dus weet niet of die in balans is. Muntjes van leerlingen wel in
balans (= H0). Dus allemaal 10x gooien.
Uitkomst:
Muntje docent --> 2x kop & 8x munt
(Teken je dit in tabelletje = steekproefverdeling)
Wilt weten --> Wat is de steekproevenverdeling?
Steekproevenverdeling maken:
Alle steekproeven van leerlingen in SPSS zetten.
Excel bestand in SPSS krijgen:
1. Download bestand
2. Naar bestanden in SPSS
3. “Import Data”
4. "CSV Data”
5. In "downloads”
6. Kijk naar “first line contains variable names” --> wil je deze aanvinken of niet? (vaak wel)
7. Delimiter controleren of dat klopt
8. (Probleem er staat achter de cijfers E+000 --> wat dan doen?:
Als je er dubbel opklikt zie je wel dat juiste cijfertje erachter staat. Alleen weergave klopt niet,
Dan --> variable view --> "type” aanpassen van "scientific” naar “numeric”)
9. Check in Variable view ook of “measures” klopt
Meetvariabele hiervan is --> ordinaal
Belangrijk voor doen analyse
- Doorloop variable view of alles klopt.
- Doorloop alle antwoorden --> kloppen die?
Hoe voorkomen dat je gekke antwoorden krijgt?
--> in qualtrics zetten dat bv. Alleen antwoord cijfer kan zijn van 0 t/m 10.
,Opruimen van gekke antwoorden
Stel vast wat je wel wilt zien. = Select Cases
Bijvoorbeeld: alle cijfers van 0 t/m 10
- Ga naar “data”
- Ga naar “select cases”
- Vul dan bij dit vb. In: variabele > = 0 & variabele < = 10
- “Paste”
Verder met de steekproeven
Willen grafiek van maken, doe je met --> Chart Builder
Grafiek die bij dit vb. Nodig is = Bar
Op x-as --> 0 t/m 10 kop
Op y-as --> frequentie gooien 0 t/m 10 kop
Wat houdt de tabel in?
Deze tabel geeft weer --> SteekproeVENverdeling
Deze tabel = GEEN Normale Verdeling = discrete kansverdeling --> biominaal (want --> er zijn
afzonderlijke categorieën DUS is het NIET continu. Kan niet 3,6 hebben bv.)
Conclusie
Docent 2x kop.
Tabel laat zien leerlingen vooral 4,5,6x kop. Maar leerlingen heeft wel ook 2.
Dus docent niet overduidelijk niet gezond.
Kan niet met zekerheid zeggen dat docent munt zuiver is.
Soorten Distributies/Verdelingen
1. Population distribution = Populatieverdeling
2. Sample distribution = Steekproefverdeling
3. Sampling distribution = Steekproevenverdeling
H1 – Steekproevenverdeling - Boek
Hoe anders had mijn steekproef kunnen zijn?
Sleutelwoorden
inferentiële statistiek, generalisatie, populatie, aselecte steekproef, steekproefstatistiek,
steekproefruimte, toevalsvariabele, steekproevenverdeling, kans, kansverdeling, discrete
kansverdeling, verwachtingswaarde/expectatie, zuivere schatter, parameter, (neerwaarts) vertekend,
, representatieve steekproef, continue variabele, continue kansverdeling, kansdichtheid, (linker/rechter)
kans.
Overzichtsvideo
Begrippen
Steekproef statistiek = Nummer beschrijft kenmerk van een steekproef
Steekproefgrootheid = waar je naar geïnteresseerd bent in je steekproef.
= kansvariabele
Proportie = deel / geheel
Steekproef ruimte = alle mogelijke waarden van steekproefgrootheid. Deze kun je vinden. Op
horizontale as.
Populatieverdeling = verdeling van hele populatie (heb je vaak niet). Op verticale as staat de
steekproefgrootheid.
Steekproefverdeling = overzicht van wat je kan aantreffen als je een steekproef trekt & hoe groot is de
kans op die uitkomst. Op verticale as staat de steekproefgrootheid.
Steekproevenverdeling = Alle mogelijke waarden van een steekproefstatistiek en hun kansen of
kansdichtheden. Op verticale as staan steekproeven.
Kansdichtheid = Een manier om de kans te bepalen dat een continue toevalsvariabele (zoals gewicht)
binnen een bepaald interval valt.
--> kans bij continue variabelen. Je kijkt hier naar reeks uitkomsten.
Bij continue toevalsvariabelen gebruik je geen kans op één specifieke waarde (zoals bij discrete
variabelen), want de kans dat een continue variabele exact één waarde aanneemt is nul. In plaats
daarvan werk je met een kansdichtheidsfunctie (pdf: probability density function).
Verwachtingswaarde/expectatie = Het gemiddelde van een kansverdeling, zoals een
steekproevenverdeling.
Zuivere schatter = Een steekproefstatistiek waarvoor de verwachtingswaarde gelijk is aan de
populatiewaarde.
--> Linkje tussen populatie & steekproevenverdeling mag je alleen leggen als je zuivere schatter hebt!
(in deze cursus altijd zuivere schatter) Linkje = verwachte waarde moet in beide hetzelfde zijn
Steekproevenverdeling
Steekproevenverdeling = cruciale link tussen de populatie & de steekproef die uit de populatie is
getrokken.
ZONDER --> niet generaliseren van steekproef naar de populatie
1000’en steekproeven nodig voor krijgen --> steekproevenverdeling!
Expected value = gemiddelde van steekproevenverdeling
True population value = gemiddelde van de steekproevenverdeling
Beperkingen steekproevenverdeling:
- Steekproef moet random zijn
- Onbevooroordeelde estimator/schatter
- Continu versus discreet --> waarschijnlijkheidsdichtheid versus waarschijnlijkheden
- Onpraktisch (1000’en steekproeven nodig) (vooral bij survey & experiment)