Statistiek
hoofdstuk 1 t/m 8
Hoofdstuk 1 Inleiding statistiek
1.1 Statistiek
Naam Leeftijd Geslacht Op kamers Beoefende
sport
Bart 18 M Ja Voetbal
Lisa 19 V Ja Tennis
Erik 17 M Nee Voetbal
Ander woord voor gegevens is data. Datamatrix is de tabel waarin alle verzamelde
gegevens worden weergegeven.
De onderzoekseenheid is datgene waarover je gegevens hebt verzameld.
(hierboven de eerst kolom)
De variabelen zijn de gegevens in de eerste rij (horizontaal), een variabele is een
kenmerk dat verschillende waarden kan aannemen en wordt gemeten of
geobserveerd.
Statistiek is het verzamelen, ordenen, samenvatten en analyseren van data. Bij
beschrijvende statistiek orden je gegevens en presenteert deze op aansprekende
wijze.
Vaak beschik je niet over de gegevens van de hele populatie waarin je
geïnteresseerd bent, maar van de gegeven van een steekproef uit de populatie. Je
gebruikt verklarende statistiek om van de steekproef te generaliseren naar de
populatie.
1.2 Variabelen en meetniveaus
Zijn 4 soorten meetniveaus, een meetniveau van een variabele bepaalt welke
statistische technieken je kunt gebruiken.
- Nominaal meetniveau bestaat uit onderscheidende factoren waar
van de een niet meer is dan de ander ( v.b.
woonplaatsen )
- Ordinaal meetniveau bestaat uit onderscheidende factoren, kan
deze categorieën ordenen op grootte ( v.b.
opleidingsniveau )
- Interval meetniveau de afstanden tussen elkaar opvolgende
getallen zijn even groot, sprake van een maat van
meer of minder. Heeft geen absoluut nulpunt
( v.b. temperatuur )
- Ratiomeetniveau ook kwantitatieve variabele, meetbaar, is ook
sprake van een maat van meer of minder. Heeft
wel een absoluut nulpunt ( v.b. leeftijd )
1.3 Discrete en continue variabelen
Variabelen verschillen ook in het aantal mogelijke waarden die ze aannemen.
,Een discrete variabele neemt alleen maar bepaalde waarden aan, zonder de
tussenliggende waarden.
Een continue variabele kan wel alle tussenliggende waarden aannemen.
Discrete en continue variabelen zijn kwantitatief, dus gemeten op
ratio/intervalniveau.
Het omzetten van een bepaalde discrete grenswaarde in een geschikte
grenswaarde voor de continue verdeling noem je de continuïteitscorrectie. Gaat
steeds om een correctie van 0,5.
1.4 Onafhankelijke en afhankelijke variabelen
Bij onderzoek is het van belang dat je weet welke relatie er bestaat tussen de
verschillende variabelen.
De onafhankelijke variabele (oorzaak) is het gegeven waarop je de
onderzoekseenheden indeelt.
De afhankelijke variabele (gevolg) is datgene wat je wilt onderzoeken. Dit varieert
ten opzichte van de onafhankelijke variabele.
Je gebruikt regressieanalyse om te onderzoeken of en hoe een continue variabele
door een andere continue variabele wordt verklaard of voorspeld.
Je gebruikt variantieanalyse als het gaat om een onafhankelijke variabele of
kwalitatief meetniveau.
1.5 Ordenen van gegevens
Bij de klassenindeling moet je voor elke uitkomst 1 plaats zijn dus de klassen mogen
elkaar niet overlappen.
De absolute frequentie is het aantal keer dat de gebeurtenis is geconstateerd.
Bij relatieve frequentie geef je de frequentie als fractie of in procenten weer.
Door te kijken naar het aantal waarnemingen beneden een bepaalde grenswaarde
bepaald je de cumulatieve frequentie. Als je van de opeenvolgende klassen steeds
de bijbehorende fracties optelt, heb je te maken met de relatieve cumulatieve
frequentie.
, Hoofdstuk 2 Gegevens presenteren
2.1 Tabellen
Een tabel moet aan de volgende eisen voldoen:
- Tabelnummer hierna wordt in de tekst verwezen
- Opschrift korte omschrijving wat er in de tabel staat
- Kolomkop korte omschrijving wat er in de kolom staat
- Voorkolom korte omschrijving wat er in de rij staat
- Logische volgorde de tabel moet een goed hulpmiddel voor de lezer zijn
- Bronvermelding een duidelijk hulpmiddel voor de lezer
Met een kruistabel maak je twee kenmerken zichtbaar.
- De frequentieverdeling per rij of per kolom is de voorwaardelijke
frequentieverdeling.
- De som van de rij- en kolomtotalen is gelijk aan de groepsgrootte n.
- Rij- en kolomtotalen noem je ook wel de rand frequenties.
- De oorzaakvariabele staat in de rij en de gevolgvariabele in de kolom.
De kolom is afhankelijk en de rij is onafhankelijk.
2.2 Steel-en-bladdiagram
Bij een steel-en-bladdiagram zet je op de horizontale as als eerste het cijfer, dit is
het stamdeel. Daarna zet je de daaropvolgende cijfers erboven of ernaast, het
bladdeel.
Op deze manier ontstaan er kolommen. Als je twee verdelingen wil vergelijken, is
een tweezijdig steel-en-bladdiagram handig.
2.3 Lijndiagram
Een grafiek zorgt voor verlevendiging bij het presenteren van gegevens. Er zijn
verschillende soorten grafieken:
- Lijndiagram
- Staafdiagram
- Stapeldiagram
- Cirkeldiagram
- Histogram
- Frequeniepolygoon
Eisen aan een grafiek: