Written by students who passed Immediately available after payment Read online or as PDF Wrong document? Swap it for free 4.6 TrustPilot
logo-home
Class notes

College aantekeningen Statistische Modellen 1

Rating
1.0
(1)
Sold
9
Pages
62
Uploaded on
18-03-2021
Written in
2020/2021

In dit document komen de colleges van Hoekstra (bachelor) en Kramer (pre-master) samen. Zowel alle powerpoints van Nestor als de pdf's en colleges van de pre-master zijn hierin opgenomen. Zo vormt dit document een compleet beeld van alle kennis voor het tentamen!

Show more Read less
Institution
Course

Content preview

Statistische modellen 1

Herhaling Kramer inleiding onderzoek
Inleiding onderzoek: beschrijvingen geven van verdelingen van scores op variabelen in een dataset

Univariate beschrijvingen (je hebt 1 variabele die je bekijkt)
• Boxplot, histogram, stemplot
• Gemiddelde, mediaan, modus
• SD, range, IQR
• Frequentietabellen

Bivariate beschrijvingen (je bekijkt de verhouding van twee variabele tot elkaar)
• Spreidingsdiagram, kruistabellen
• Correlatie, gowers, rho, tau, kappa

Drie soorten kenmerken/variabelen
1. Onafhankelijke variabelen: hebben gevolgen maar zijn geen gevolgen
Vb: al dan niet bijles hebben gehad
2. Afhankelijke variabelen: zijn gevolg
Vb: behaalde tentamencijfers
Causaliteit: bijles veroorzaakt tentamencijfer (Schematisch: A → B)
Niet causaal schematisch: A – B
3. Indirecte controlevariabelen: kenmerken die te onderzoeken relatie beïnvloeden
Vb: collegeaanwezigheid

Meetniveau van een variabele
Soort variabele Meetniveau
Categorische variabelen (ook wel kwalitatieve Nominaal
variabelen genoemd) Ordinaal
Kwantitatieve variabelen Interval
Ratio

➢ Meetniveau ligt niet vast, gebruiker kiest meetniveau
➢ Geeft aan welke informatie in scores op variabele je serieus neemt

Een eerste blik op data (beschrijvend)
Inspecteer scores per variabele
1. Grafisch / Frequentietabel: eerst plaatjes maken. Je zoomt in op het deel waar scores
zichtbaar zijn en uitschieters rapporteer je apart.
2. Samenvattingsmaten: nu ga je dingen uitrekenen.
a. Centrummaten (mediaan, gemiddelde, mode)
b. Spreidingsmaten
i. Spreidingsmaten gebaseerd op hoever scores van elkáár afliggen: Range, Five
number summary, IQR
ii. Spreidingsmaten gebaseerd op hoever scores van gemiddelde afliggen:
Variantie, Standaarddeviatie

Let hierbij op:
1. Verdeling van scores (vorm, uitbijters)
2. Centrum (‘midden’) van scores
3. Spreiding van scores

,Gemiddelde, mediaan, modus
➢ Verdeling symmetisch: mediaan = gemiddelde = modus
➢ Verdeling niet symmetisch = scheve verdeling = mediaan en gemiddelde niet gelijk.
Gemiddelde < mediaan = staart aan de linkerkant (linksscheve verdeling).
Gemiddelde > mediaan = staart aan de rechterkant (rechtsscheve verdeling)
➢ Verdeling scheef? GEMMEDIAANMODUS




Grafische weergave boxplot




Variantie (tussenstap naar standaarddeviatie)
1. Bereken de gemiddelde scoren
2. Bereken de afwijkingen tussen individuele
scores en gemiddelde
3. Bereken het gemiddelde van gekwadrateerde afwijkingen
• Door te kwadrateren tellen extreme scores zwaarder mee
• Uitkomst vertelt je wat de gemiddelde gekwadrateerde afstand
tot het gemiddelde is… wordt daarom alleen gebruikt om mee
door te rekenen → zie volgende

,Variantie en standaarddeviatie
Variantie: Standaarddeviatie:




➢ Let op: Delen door N- 1 (statische reden)
➢ De standaarddeviatie vertelt je dan wat (globaal genomen) de ongekwadrateerde
gemiddelde afstand tot het gemiddelde is. Een grotere standaarddeviatie staat dan dus gelijk
met meer spreiding in scores bij de variabele

Verdelingen – Curves
Curve beschrijft het verloop van de staven ‘heel aardig’.
➢ Soms teken je in een grafiek een curve. Dit hoeft niet helemaal perfect te zijn, maar het
verloop van bijv. staven aardig beschrijven.
➢ Wiskundig model
➢ Ondervangt nadelen van de histogram: je kunt heel makkelijk rekenen welk deel van de
mensen in een bepaald deel of interval passen. Relatief eenvoudig uit te rekenen.
➢ Geeft aan hoeveel van de scores in een willekeurig te kiezen interval vallen
➢ Altijd boven de x-as
➢ Totale oppervlakte onder de curve is op 1 gesteld.
➢ Oppervlakte boven een bepaald interval geeft aan welk deel van de scores in dat specifieke
interval viel.
➢ Curve geeft geen frequenties/getallen. Y-waarde zelf is niet interpreteerbaar. Je moet alleen
naar oppervlaktes onder de curve kijken. Je weet niet hoeveel mensen in een bepaald
gebied/oppervlakte zitten, maar wel welk deel van de mensen.

Voordelen van dichtheidscurve
1. Je kan eenvoudig bepalen hoeveel van de scores in een willekeurig te kiezen interval vallen
2. Je zit niet vast aan de frequentie per klasse van scores
Nadeel: afhankelijk van dikte staafjes.




Kenmerken dichtheidscurve
1. Ligt altijd boven de X-as
2. Totale oppervlakte onder de curve is 1 (= 100%)
3. Oppervlak onder de curve voor een bepaald interval van waarden geeft aan welk deel van de
scores in dit interval valt = ‘dichtheid’ van scores in dat interval

, NB: dichtheidscurve geeft geen frequenties
➢ Y-waarde zelf niet interpreteerbaar
➢ Alleen naar oppervlaktes onder de curve kijken

Symmetrische (unimodale) verdeling
➢ Gemiddelde = mediaan = modus
➢ Standaarddeviatie (s) = afstand tussen midden en buigpunt

Normale verdelingen
➢ Er is niet 1 normale verdeling, maar een hele klasse
➢ Met verschillen in gemiddelde () en standaardafwijking ()




Wat is er zo belangrijk aan die normale verdelingen?
➢ Veel verdelingen in de praktijk (bijv. IQ, lengte per geslacht) zijn ongeveer normaal
➢ Uitkomsten van kansprocessen vaak vrijwel normaal verdeeld
➢ Nuttig bruikbaar bij bepaling van onzekerheidsmarges van betrouwbaarheidsintervallen
(statistische modellen 1)
➢ Ze hebben algemene eigenschappen. Je kunt daar altijd van op aan en mee rekenen.
Echter: ook veel verdelingen in de praktijk zijn niet normaal, maar wel interessant.

Hoe controleer je of verdeling ongeveer normaal is?
1. Maak een histogram en kijk of je ‘klokvorm’ hebt
Maar: histogram is sterk afhankelijk van intervalbreedte (breedte staafjes)
2. Gebruik daarom: ‘Normal Quantile Plot’

Written for

Institution
Study
Course

Document information

Uploaded on
March 18, 2021
Number of pages
62
Written in
2020/2021
Type
Class notes
Professor(s)
Hoekstra en kramer
Contains
All classes

Subjects

$6.46
Get access to the full document:

Wrong document? Swap it for free Within 14 days of purchase and before downloading, you can choose a different document. You can simply spend the amount again.
Written by students who passed
Immediately available after payment
Read online or as PDF


Also available in package deal

Reviews from verified buyers

Showing all reviews
3 year ago

1.0

1 reviews

5
0
4
0
3
0
2
0
1
1
Trustworthy reviews on Stuvia

All reviews are made by real Stuvia users after verified purchases.

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
AMBR Rijksuniversiteit Groningen
Follow You need to be logged in order to follow users or courses
Sold
234
Member since
6 year
Number of followers
158
Documents
43
Last sold
2 months ago

3.9

24 reviews

5
8
4
9
3
4
2
2
1
1

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Working on your references?

Create accurate citations in APA, MLA and Harvard with our free citation generator.

Working on your references?

Frequently asked questions