HC1: Inleiding
Onderzoeksproces
- Conceptualiseren – probleem-, vraag-, doelstelling
- Concretisering – onderzoeksopzet
- Verbreding – dataverzameling en verwerking
Statistiek overal in nodig
Beschrijvende (descriptieve) statistiek – ordenen en presenteren gegevens in samenvattende getallen, tabellen,
grafieken en figuren
Toetsende statistiek – bepalen van relaties tussen concepten onderling en achterhalen in hoeverre gegevens
overeenkomen met theoretische verwachtingen
Oefenen in grasple, verdiepingsopgaven (BS), voorbeeldvragen VSO, oefententamen
Terminologie
Variabele – een gemeten grootheid die kan variëren
- Afhankelijke variabele – gevolg/uitkomst – te verklaren met onaf. variabele (rechts)
- Onafhankelijke variabele – oorzaak/voorspeller – verklaring voor afh. variabele (links)
- Modererende variabele – verzwakt of versterkt het verband tussen twee andere variabele
- Mediërende variabele – kan (deels) het verband tussen twee andere variabelen verklaren
- Discrete variabele – kan slechts een bepaald aantal waarden aannemen (altijd heel)
- Continue variabele – tussen twee gegeven waarden ligt een derde (kommagetallen)
- Categorische (kwalitatieve) variabele – nominaal of ordinaal categorieënsysteem
- Kwantitatieve variabele – interval of ratio categorieënsysteem
Onderzoekseenheid (case) – eenheid waarbij variabele gemeten wordt
Score – waarde van een onderzoekseenheid
Datamatrix – ‘tabel’ met variabele in kolom, onderzoekseenheid in rij met daarbij de score
Meetniveaus – niveau van meten
o Kwalitatieve variabelen
- Nominaal – waarden geven categorieën aan (geen volgorde – kleur, geslacht)
- Ordinaal – oplopende categorieën (wel volgorde – opleiding, klasse)
o Kwantitatieve variabelen
- Interval – waarden geven volgorde aan met gelijke intervallen tussen de waarde
- Ratio – waarden geven volgorde aan met gelijke intervallen tussen de waarde MET 0-PUNT
o Hierdoor is het mogelijk ‘A is 2x zo lang als B’ te zeggen
Rechts scheve = modus < mediaan < gemiddelde
Links scheve = gemiddelde < mediaan < modus
,SPSS = interval/ratio hetzelfde – aangeduid met ‘scale’
Eerste vraag bij onderzoek: afh of onaf? – daarna met welk meetniveau
Methodebeschrijving – beschrijving participanten
Frequentieverdelingen
Absolute frequentie (fi) - het aantal keer dat een bepaalde waarde (X i) voorkomt, totaal N=…
Relatieve frequentie – absolute frequentie omgezet naar proportie of procenten
- Proportie – van 0 tot 1
Pi = f i / N
- Percentage – van 1 tot 100
Percentage = proportie * 100
Cumulatieve frequentie – oplopend/opklimmend (bij elkaar opgeteld)
- cfi = Σf1 + f2+ f3 + …
Cumulatieve relatieve frequentie – cumulatieve absolute frequentie gedeeld door het totaal
- ?
Percentielen P – cumulatieve percentages - veel gebruikt bij diagnostische processen
- Van score X naar percentiel P
- Van percentiel P naar score X
- Decielscore – P*10 - D1 = P10, D2 = P20, D3 = P30
- Kwartielscore – P*25 - Q1 = P25, Q2 = P50, Q3 = P 75
Valide percent – missings niet meegenomen
- Welke gebruiken? – afhankelijk van of missings random zijn
NAAR BENDEN AFRONDEN – niet naar boven want waarde is nog niet bereikt
, HC 2: centrum en spreiding
Centrummaten – geven aan rond welke waarde/score de onderzoek elementen gecentreerd liggen
om bijvoorbeeld groepen met elkaar goed te kunnen vergelijken
eenvoudig voor het schatten van waarde
Verschillende centrummaten:
- Modus – meest voorkomende waarde (SPSS: mode)
o 2 modus = 2 modi = bimodaal, meerderde = multimodaal
o Alle waarden even frequent – geen modus
- Mediaan – de waarde van de middelste waarneming wanneer de waarnemingen in volgorde van laag naar
hoog staan (=P50, 50e percentiel) (SPSS: mediaan)
o Oneven aantal waarnemingen – middelste score
o Even aantal waarnemingen – midden tussen de twee middelste scores
o Niet gevoelig voor uitschieters
o Maar weinig informatie, minder geschikt om mee verder te rekenen
- Gemiddelde – gebaseerd op de hoogte van alle werkelijke scores (SPSS: mean)
o Niet bij ordinaal of nominaal meetniveau
o Formule – zie pwp HC2
o Gevoelig voor uitschieters
Gewogen gemiddelde
o Formule – zie pwp HC2
mu = populatie-gemiddelde = gehele groep
X = steekproef-gemiddelde = deel van de populatie (onderzoek kan vaak niet onder gehele populatie)
Uitschieters
- Kan grote invloed hebben op gemiddelde, niet op mediaan
Scheefheid (SPSS: skewness=mate van scheefheid) – frequentieverdeling
- De verdeling is niet symmetrisch, in tegenstelling tot de normale verdeling
o Links/negatief scheef = staart naar links gemiddelde, mediaan, modus
o Recht/positief scheef = staart naar rechts modus, mediaan, gemiddelde
Normaal verdeling – klokvormig, symmetrisch en eentoppig
Spreidingsmaten – info over afstand tussen datapunten, variatie in de andere scores in steekproef
- Hoe ver liggen scores uit elkaar (vanaf ordinaal meetniveau)
o Range
o Interkwartielafstand
- Hoe liggen scores t.o.v. gemiddelde (vanaf interval meetniveau)
o Variantie
o Standaarddeviatie
Range = Xmax – Xmin
Interkwartielafstand = IKA (moeilijk mee verder te rekenen)
- Q1 = 1e kwartiel = mediaan onderste helft (P25)
- Q2 = 2e kwartiel = mediaan (P50)
- Q3 = 3e kwartiel = mediaan bovenste helft (P75)
- Q4 = 4e kwartiel (P100)