Cijfers Spreken, door Joep Brinkman
Herhaling Onderzoek en Statistiek I
Onafhan elij e variaeelej Variabele die geacht wordt te beïnvloeden
Afhan elij e variaeelej Variabele die wordt beïnvloed
Schaalj het geheel van mogelijke meetwaarden van een bepaalde variabel
Kunnen ook woorden zijn
Noekminale ichalen
j Als de waarden van een variabele in feite alleen maar namen zijn
Indelen van objecten in categorieën. Als er maar twee categorieën zijn spreek je van een dichoektoekme
ichaal.
Volgorde mag veranderen als je een getal toe kent
Ordinale ichalen
j Als de schaalwaarden een volgorde met betekenis kennen
Volgorde mag hier niet veranderen als je een getal toe kent
Variabelen van deze schalen worden walitateve variaeelen genoemd omdat meetwaarden als
getal geen betekenis hebben
Intervalichalen
j Na een metng hiermee kun je meetwaarden van elkaar afrekken en dat verschil vergelijken met
andere verschillen tussen meetwaarden
Deze schaal kent geen ‘natuurlijk nulpunt’ (bijv. je kan niet zeggen dat water van 80 graden 2 keer zo
warm is dan water van 40 graden. Het nulpunt is bij graden, Fahrenheit en Kelvin willekeurig. Bij een
temperatuur van 0 betekent het niet dat er geen temperatuur is.
Je kunt niet zeggen dat A zoveel maal dit of dat is als B, maar je kan wel gemiddelden berekenen)
Ratoekichalen
j Hebben wel een natuurlijk nulpunt (nulpunt is voor elke eenheid gelijk)
Verhouding tussen meetwaarden kan worden berekend. Je kunt meetwaarden door elkaar delen.
Variabelen van deze schalen worden wanttateve variaeelen genoemd omdat de getallen wel een
betekenis hebben
Tellen is een bijzondere ratoschaal. Het gaat om aantallen, zonder eenheid.
Hoofdstuk 8: Rekenen op kansen
8.8. Binoekmiale verdelingen nader ee e en
Linker overschrijdingskans= de kans op die uitkomst of een nog lagere uitkomst.
Rechte overschrijdingskans= uitkomsten die hoger zijn.
Om de rechter overschrijdingskans voor 16 te bepalen moet je de cumulateve kans (=linker
overschrijdingskans) van 15 opzoeken en deze van 100% afrekken.
Om P(k=15) te berekenen moet je de cumulateve kans P(K≤14) afrekken van de cumulateve kans
P(k≤15).
Opzoekregels tabel B:
- Linker overschrijdingskans: direct opzoeken bij de betrefende k.
- Rechter overschrijdingskans: de kans opzoeken bij k-1; deze kans afrekken van 100%
- De kans op precies een bepaalde k:
1. De (linker overschrijdings)kans opzoeken van k
2. Dan de (linker overschrijdings)kans opzoeken van k-1
3. De kans van 2 afrekken van de kans van 1
8.12. itee proekefgegeveni ali uit oekmit van een aniproekcei
De relateve frequente van een bepaalde meetwaarde geef de kans weer dat, wanneer je een
toevallig element uit die verzameling objecten tref, dat object die meetwaarde heef.
, Frequenteverdeling van een variabele in een populate biedt de kansverdeling van de waarden van
een willekeurig steekproefelement op die variabele (bijv. bepaalde menselijke populate bestaat voor
40% uit mannen, dan is er voor elk afzonderlijk persoon in de steekproef de kans dat dit een man is
40%). De populateporte (π) bepaalt de kans dat de steekproefproporte (p) zus of zo groot uitvalt.
De feitelijke proporte mannen in de steekproef zal waarschijnlijk niet precies 40% bedragen, maar er
in de meeste gevallen wel ergens in de buurt liggen. De omvang van grootheden in de populate
bepaalt dus de kansverdeling van grootheden in een steekproef. Steekproefgegevens zijn het
resultaat van een kansproces, waarbij de stand van zaken in de populate de kansen op bepaalde
uitkomsten bepaalt. Grootheden in populate worden daarom met andere symbolen aangeduid dan
grootheden in de steekproef (Griekse leters populategrootheden/parameters) (Romeinse voor
grootheden zoals gevonden binnen een steekproef/stochasten). Doorgaans ken je de waarden van
parameters niet, wel die van stochasten. Op grond van de steekproefgegevens probeer je een
schatng te maken van de omvang van de parameters.
Hoofstuk 9: Betrouwbaar schatten
9.1. Inducteve itatite en anire ening
De kansrekening gaat uit van bekende gegevens over de populate om van daaruit de kans op
waarden in de steekproef te berekenen. Met behulp van de inducteve statstek probeer je
parameters te schaten op basis van stochasten. Dat gebeurd door gebruik te maken van de
kansrekening.
Je wilt de voor de steekproef berekende waarden gebruiken als schattrs voor de overeenkomstge
parameters. Wanneer je de waarde die je in een steekproef vindt zonder meer gebruikt als geschate
waarde van een parameter, maak je een puntschatni (bijv. steekproef van 134 lampen, gemiddelde
brandduur 756 uur, gemiddelde brandduur van alle lampen ligt op 956: puntschatng).
9.2. Het principe van eetroekuweaarheidiintervallen
Gemiddelde van een steekproef zal gelden precies gelijk zijn aan gemiddelde in de populate.
Onderzoeker schat de populate niet precies op wat hij in de steekproef vindt, maar met een
bepaalde marit daaromheen (bijv. in steekproef sporten mensen gemiddeld 8 uur per week,
populategemiddelde kan dan zijn: 7 uur per week ≤ µ ≤ 9 uur per week).
Dit noem je een bttrouwbaarhtidsinttrval (BI, of Engels: CI, confidtnct inttrval).
Interval valt te berekenen met de kansrekening. Betrouwbaarheidsinterval geef nooit volledige
zekerheid: bij de berekening ervan hoort een percentage dat aangeef hoe groot de kans is dat de
parameter werkelijk in dat interval ligt (bijv. kans dat werkelijke gemiddelde sportjd tussen 7 en 9
uur ligt kan bijvoorbeeld 95% zijn: P(7≤ µ ≤ 9) = 95%. Kans zou dan 5% bedragen dat het werkelijke
gemiddelde lager ligt dan 7 of hoger dan 9 uur: foutkans).
De foutkans wordt ook wel aangegeven met de Griekse leter alfa: α.
Wat een acceptabel betrouwbaarheidspercentage is, is een min of meer persoonlijke keuze van de
onderzoeker. Gangbaar zijn 95% en 99%.
Twee onzekerheden bij betrouwbaarheidsinterval:
1. Nauwkturiihtid: breedte van interval (bijv. 7 tot 9 is nauwkeuriger dan 6 tot 10).
2. Bttrouwbaarhtid: gekozen kans dat interval klopt.
Hoe groter (=breder) een betrouwbaarheidsinterval is, des te groter de slag is die de onderzoeker
kennelijk om de arm houdt, en hoe minder nauwkeurig de schatng dus is. Maar des te groter is de
zekerheid dat de werkelijke waarde van de populate ook binnen het interval ligt, en des te
betrouwbaarder de schatng is. Door lager betrouwbaarheidspercentage te kiezen, kun je tot een
nauwkeuriger schatng komen maar je kunt er minder van op aan dat deze ook waar is. Wat je wint
aan de ene verlies je aan het andere (bijv. kans dat het morgen tussen -2 en +42 graden is, is zo goed
als 100% zeker maar heel onnauwkeurig, kans dat het tussen +16 en +26 is, is kleinere kans
(misschien 90%-betrouwbaarheid) maar wel nauwkeuriger).
Naarmate de steekproef groter is kun je beter schaten. Door grotere steekproef maak je de
schatng nauwkeuriger of betrouwbaarder. Of een combinate. Naarmate de spreiding van de