Aantekeningen college 1: Herhaling Statistische modellen 1
Rink Hoekstra – docent
Vragen:
Welke hoofdstukken staan gelijk aan het Nederlandse boek voor dit vak?
➢ Daar weet rink niet wat vanaf. Jacco gemaild
Moeten we de practica inleveren?
➢ Nee oefenen voor jezelf en JASP gebruiken → vooral interpretatie.
Stof:
Agresti and Finlay
› H9: regressie-analyse en correlatie
› H11: multipele regressie
› H12: variantieanalyse (ANOVA)
› H13: regressie en ANOVA
› H15: logistische regressie
› ANCOVA: extra tutorial
› Extra stof (zie dlo)
Digitale leeromgeving:
➢ Opnames
➢ Practicumopdrachten (nadere informatie volgt)
➢ Organisatorische veranderingen
Wat wordt van jullie verwacht?
➢ Bijhouden stof
➢ Maken + begrijpen practicumopdrachten
Practicumopdrachten:
➢ Thuis te maken door middel van JASP
o Hier te downloaden
➢ Oefenen met de stof
➢ Niet verplicht (maar wel sterk aan te raden!)
➢ Docent beschikbaar voor vragen tijdens 3 momenten
Plan vandaag:
➢ Introductie (10 minuten)
PAUZE (5 minuten)
➢ Hoofddoelen statistiek (2 min)
➢ Onderscheid beschrijvende en inferentiele statistiek (2 min)
➢ Steekproevenverdeling (10 minuten)
PAUZE (5 minuten)
➢ Betrouwbaarheidsintervallen (15 minuten)
PAUZE (5 minuten)
➢ Toetsen (20 minuten)
➢ Afronding (5 minuten)
, ➢ Tijd voor vragen (…)
Spelregels online college:
➢ Vragen stellen via de chatfunctie
o Probeer enigszins terughoudend te zijn in het aantal vragen
o Probeer evt. elkaars vragen te beantwoorden
➢ Regelmatig pauzes om vragen te bekijken
➢ NB: geen garantie dat alle vragen tijdens college beantwoord worden!
➢ Vragen die speficiek voor jou gelden liever via de mail
➢ Colleges worden opgenomen (en zijn dus terug te kijken)
Hoofddoelen statistiek:
➢ Samenvatting van gegevens
o Beschrijvende statistiek (Inleiding onderzoek)
▪ M.n. maken plaatjes, berekenen samenvattingsmaten
➢ Aangeven van onzekerheid
o Inferentiële statistiek (Statistische Modellen 1 en 2)
▪ Wat zegt steekproefuitkomst over de populatie?
Terminologie:
➢ Populatie: groep waarvan onderzoeker eigenschappen wil weten
➢ Parameter: numerieke samenvatting van eigenschap in populatie
o Hoe lang is de Nederlandse man?
➢ Steekproef: subgroep uit populatie die onderzocht wordt
➢ Statistic/schatter: numerieke samenvatting van eigenschap in steekproef
o wat je eigenlijk zou willen weten van jouw steekproef
o gemiddelde lengte van de mannen in jouw steekproef.
➢ we hebben een statistic en willen een schatting maken van de populatie
➢ Hoe?
o Op basis van theorie → wat zou er gebeuren als je heel vaak een steekproef neemt.
▪ Hoe ziet de verdeling er ongeveer uit? Als we de populatie zouden weten →
steekproevenverdeling.
▪ Dat als je heel vaak een steekproef trekt, komt er elke keer net iets anders uit.
o Praktijk → maar 1x een steekproef doen.
▪ Op basis van statistic schatting maken van parameter → dat kunnen we alleen als
we een gebruik maken vanuit de theorie (normale verdeling) en hiermee rekenen.
,Inferentiële statistiek:
➢ Voorbeeld: het gemiddelde in de steekproef kun je gebruiken om
o het gemiddelde in populatie te schatten
o kansuitspraken te doen over het gemiddelde in de populatie
▪ dit is vrij waarschijnlijk/onwaarschijnlijk → hoe ver ligt het af van het gemiddelde,
hoe onwaarschijnlijker het wordt.
➢ Nodig om kansuitspraken te doen:
o steekproevenverdeling:
▪ Wat gebeurt er wanneer we het over zouden doen?
➢ Ter vermaak: Onbegrepen Statistiek (vanaf 11:30)
Steekproevenverdeling: → basis voor twee inferentiële technieken betrouwbaarheidsintervallen en
toetsen (significantie toetsen)
➢ Waar heb je steekproevenverdelingen voor nodig?
o Betrouwbaarheidsintervallen: foutenmarge
o Toetsen: p-waarde
➢ Online tool voor steekproevenverdeling
Twee methoden voor inferentie:
1. Betrouwbaarheidsintervallen
o Indicatie van de parameter (bij herhaald steekproeftrekken)
o Interval rondom je steekproefuitkomst (ligt er altijd in)
2. Hypothesetoetsen (significantietoetsen of toetsen)
o “de kans op deze steekproefuitkomst is zo klein als de nulhypothese waar zou zijn, dat
het onwaarschijnlijk is dat de populatiegrootheid die waarde (H0) heeft”
o H0 buiten gewoon onwaarschijnlijk → H0 verwerpen
➢ Populatie en steekproef
1) Betrouwbaarheidsintervallen
o Bhi gebaseerd op steekproevenverdeling rond parameter (bv. µ, π)
▪ Middelste C% van de verdeling → breedte van het interval, bijv. 95% (zie plaatje)
▪ Afstand tot midden = margin of error (foutenmarge)
• Margin of error (foutenmarge) = kritieke waarde * standaardfout (SE)
• Afstand van het midden tot de rand van de verdeling
• Kritieke waarde → hoeveel standaarddeviaties of standaardfouten moet je van
het midden af te liggen om daar een bepaald aantal percentages tussen te
krijgen. 95% is 2 standaarddeviaties (vuistregel) is 1.96, ongeveer 2.
o
▪ 9 komt uit een voorbeeld
▪ Dit is theoretische verdeling
, ➢ Steekproevenverdeling met onderlinge steekproeven die genomen zijn.
o Altijd rond steekproefuitkomst → interval maken gebaseerd op 95% van het interval.
o Iedere keer ander interval
o Doel: schatten parameter
o Algemeen: informatiever dan significantietoets
Interpretatie betrouwbaarheidsinterval:
➢ Als we heel vaak een betrouwbaarheidsinterval op deze manier zouden opstellen, zou dit in
C% van de gevallen de parameter omvatten
o C = 95 of 99, het percentage bhi dat je kiest
of
➢ Als ons betrouwbaarheidsinterval de parameter omvat (en dat is het geval in C% van de
steekproeven), dan ligt de parameter tussen [ondergrens] en [bovengrens]
en dus niet
➢ We zijn nu 95% zeker dat de parameter ligt tussen [ondergrens] en [bovengrens]
Vaste opbouw betrouwbaarheidsinterval:
➢ Statistic +/- margin of error
Ofwel
➢ Statistic +/- kritieke waarde * standaardfout
o Kritieke waarde: Z* of T*, Die kon je opzoeken in de tabel en dat hangt af van het
betrouwbaarheidsinterval(95%, 90% OF 70%)