Stuur me na aankoop een berichtje om het wachtwoord van de
Online studeren bij https://quizlet.com/_e0njau quizlet set te ontvangen, zodat je ook op quizlet kunt oefenen!
Manier van denken over data en kwantificering van onzekerheid.
Het analyseren van data van een onderzoek. Doel is vertalen van
Statistics
data in kennis en begrip van de wereld om ons heen. Kunst en
wetenschap van leren van data.
1. Design:
Het doel/statistische vraagstelling melden en plannen van
het verkrijgen van de data die nodig is om de statistische
vraagstelling te beantwoorden.
2. Description (beschrijving):
Samenvatten en analyseren van de verkregen gegevens/verza-
3 belangrijkste componenten voor het beantwoorden van een
melde data. Doel is het verminderen van de data naar simpele
statistische vraag
samenvattingen zonder al te veel informatie te verliezen. "Ik heb..."
3. Inference (gevolgtrekking):
Besluiten nemen en voorspellingen maken gebaseerd op de data
om de vraag te beantwoorden + rapporteren v/d precisie van
de voorspelling. Gaat vaak over de populatie en niet alleen de
steekproef. "Ik verwacht..."
een maat voor de verwachte variabiliteit
tussen de ene aselecte steekproef en de
Margin of error
volgende aselecte steekproef. En hoever dat
dus afwijkt van de populatiewaarden.
zegt iets over hoe vaak we verwachten dat de margin of error
Confidence interval
klopt met de populatiewaarde.
1. Probleemstelling;
2. Ontwerp van het onderzoek - design;
Fasen in onderzoek 3. Dataverzameling (steekproef uit de populatie)
4. Data-analyse - description & Inference;
5. Rapportage;
samenvatten van verzamelde data d.m.v.
Beschrijvende statistiek (description)
patronen (grafieken, percentage)
verwijst naar methoden voor het nemen van beslissingen of voor-
Inferentiële statistiek (inference) spellingen over een populatie op basis van gegevens die zijn
verkregen uit een steekproef van die populatie.
Een framework/kader voor het bepalen/weergeven hoe
Probability / kans
waarschijnlijk verschillende mogelijke uitkomsten zijn.
Hoe vaker je iets herhaalt, hoe beter je observatie aansluit bij de
Long-run probability / lange termijn kans
daadwerkelijke kans.
Datgene wat we onderzoeken, dus de de entiteiten die worden
Subjects gemeten (meestal mensen, maar hoeft niet, kunnen ook
scholen, landen of dagen zijn). Groep van subjecten = populatie.
Steekproef/sample de groep elementen die getrokken wordt uit de populatie
de verzameling van alle potentieel waarneembare waarden
Populatie waarop een onderzoeksprobleemstelling (of hypothese) be-
trekking heeft
numerieke samenvatting van een deel uit de populatie, steekproef
Sample statistic
(bijv proportie of gemiddelde)
Getal dat een eigenschap van een populatie weergeeft. Statistis-
che gegevens over de populatie. Numeriek
(Populatie) parameter overzicht van de bevolking/populatie. De ware parameter is
meestal onbekend. Daarom gebruiken we sample statistics om
de parameter waarde te schatten.
Getal dat een eigenschap van een steekproef weergeeft. Statis-
Statistic tische gegevens over de sample. Numeriek overzicht van
de sample.
Random sampling
, Beschrijvende statistiek 2023
Online studeren bij https://quizlet.com/_e0njau
Wanneer elk subject in de populatie dezelfde kans
heeft om in de sample te komen. Nodig om de sample
representatief te maken voor de populatie. Dit om een krachtige
gevolgtrekking te kunnen maken en om het onderzoek te kunnen
presenteren (externe validiteit)
Data file Organisatie van grote hoeveelheid data, bijv. in een spreadsheet.
1. Elke (horizontale) rij bevat een meting voor een specifiek subject
(bijv een persoon)
Twee basisregels bij datafiles
2. Elke (verticale) kolom bevat een meting voor een specifiek
kenmerk
Database Bestaande collectie van dataverzameling (bijv google)
Een programma voor het uitvoeren van een specifieke taak. Door
het gebruik van een applet kunnen steekproeven van kunstmatige
populaties genomen worden, waarna deze geanalyseerd kunnen
Applet (apllication)
worden om de eigenschappen van de statistieke methoden te
bekijken. Dit is een soort van simulatie waarbij je kan nabootsen
wat werkelijk zou gebeuren als je een steekproef zou nemen.
In de statistiek wordt hiermee bedoeld dat een gevonden resultaat
Statistisch significant
(waarschijnlijk) niet op toeval berust.
Variabele Elk kenmerk dat wordt geobserveerd in de studie.
als waarnemingen numerieke waardes hebben die
verschillende grootheden van de variabele vertegenwoordigen.
Meten 'hoeveel van iets'. Hierbij kan je rekenkundige samen-
Kwantitatieve variabelen vattingen maken zoals gemiddelde of een grafiek gebruiken die
de variabele beschrijven. Elke waarde die het kan aannemen is
een nummer.. Cijfers moeten wel grootte aangeven (dus geen
postcode, ene is niet groter dan andere).
- Discrete gegevens
Kwantitatieve variabelen zijn onder te verdelen in:
- Continue gegevens
Hele waarde met een eindig aantal mogelijke
waarden (bijv. aantal huisdieren/kinderen). In de praktijk worden
Discrete kwantitatieve variabele door onze menselijke tekortkomingen alle variabelen discreet
gemeten (we zijn geen computers die tot in het oneindige waarden
kunnen bepalen).
Waarde die op een continuüm ligt en oneindig kan zijn. Dus niet
Continue kwantitatieve variabele
enkel hele waarden, maar ook halven (bijv lengte, tijd etc.)
variabelen nemen kenmerken/categorieën aan ipv cijfers
Categorische/kwalitatieve variabelen (wel/geen neerslag op een dag). Kan wel geuit worden in getallen
maar dan gaat het nog steeds om categorieën.
de categorie met de hoogste frequentie, deze is beperkt omdat
Modus
het maar één aspect laat zien.
Aantal van de waarnemingen in een categorie gedeeld door het
totaal aantal waarnemingen (deel van het geheel).
Proportie
--> Is dus eigenlijk een ander woord voor kans!
Percentage de proportie x 100
Relative frequencies proporties en percentages
Centrummaten Gemiddelde, mediaan en modus.
Observaties De gegevenswaarden die we observeren voor een variabele
Lijst van mogelijke waarden voor een variabele, samen met het
Frequentietabel aantal observaties per waarde. Te gebruiken bij kwantitatieve vari-
abelen. Toont de numerieke distributie.
Distributie van een variabele