Hoorcolleges statistiek 2 2024-2025
Hoorcollege 1: 2 september 2024
Herhaling statistiek 1
Meetniveaus
- Kwalitatief: geen nummer, grootte of kwantiteit
- Nominaal
o Een categorie is niet meer of minder dan de ander
§ Appel, peer en banaan of man en vrouw
- Ordinaal
o Er is een rank order maar de afstanden zijn niet gelijk
§ Huisspin, wolfspin en vogelspin
- Kwantitatief: getal met betekenis
- Interval
o Verschil tussen waarde kan geïnterpreteerd en vergeleken worden maar
er is geen absoluut nulpunt
§ IQ-score, depressie score etc.
- Ratio
o Verschil tussen waarde kan geïnterpreteerd en vergeleken worden en er is
een absoluut nulpunt
§ Gewicht, lengte, salaris
,Een verdeling kan symmetrisch, rechts scheef en links scheef verdeeld zijn. Er zijn
verschillende maten om data samen te vatten:
- Gemiddelde (de som van alle scores gedeeld door het aantal scores)
- Mediaan (middelste waarde)
- Modus (meest voorkomende waarde)
Wanneer een verdeling symmetrisch is zijn het gemiddelde, de mediaan en modus
gelijk. Zodra variabele scheef verdeeld zijn gaan deze uit elkaar. Gemiddelde zullen
dan altijd hoger zijn dan mediaan en modus.
De variantie is de gemiddelde spreiding rond het gemiddelde. De
standaarddeviatie is de wortel van de variantie.
De z-score is het aantal standaarddeviaties dat een score verwijderd is van het
gemiddelde. Dit is een informatieve score omdat dit in verhouding is met het
gemiddelde en dus erg informaties is.
Een normale verdeling is een speciale symmetrische verdelen. Dit zal altijd
voorkomen wanneer je een steekproef trekt met een hoog aantal deelnemers. De IQ-
score is een voorbeeld van een normaal verdeelde score.
-/+ 1 SD van het gemiddelde = 68%
, Toetsende statistiek
Wat is het effect van kauwgom kauwen?
Nulhypothese (H0): er is geen verschil tussen de groep die wel kauwgom kauwt en
geen kauwgom kauwt.
Alternatieve hypothese (HA): er zit verschil tussen de groep die wel kauwgom
kauwt en geen kauwgom kauwt.
Door mensen random in te delen in verschillende groepen zorg je dat er sprake is van
twee equivalente groepen. Verschillen en overeenkomsten berusten daardoor op
toeval. De onafhankelijke variabele zou in dit geval kauwgom kauwen zijn. De
afhankelijke variabele zou in dit geval het testresultaat zijn.
Er is sprake van evidentie wanneer een waarde in de staart – dus minimaal twee
standaarddeviaties van het gemiddelde – van de normaalverdeling ligt. Op het
moment dat er sprake is van evidentie kan de nulhypothese verworpen worden.
Wanneer je onterecht een nulhypothese verwerpt wordt dit een type 1 fout
genoemd. De rechter bevindt onterecht iemand schuldig (hallucineren).
Wanneer je onterecht een nulhypothese behoudt wordt dit een type 2 fout genoemd.
De rechter spreekt onterecht iemand vrij (blind).
Om te bedenken of een uitslag wel of niet uitwijkend is heb je een niet een verdeling
van de populatie of steekproef nodig, maar een verdeling van alle gemiddeldes die we
zouden krijgen als we de test zouden herhalen. Dit wordt de
steekproevenverdeling genoemd. Je gaat er altijd vanuit dat deze normaal
verdeeld is.
De norm is een tweezijdige verdeling, tenzij voorafgaand al duidelijk is dat er sprake
is van een daling of vergroting
Hoorcollege 1: 2 september 2024
Herhaling statistiek 1
Meetniveaus
- Kwalitatief: geen nummer, grootte of kwantiteit
- Nominaal
o Een categorie is niet meer of minder dan de ander
§ Appel, peer en banaan of man en vrouw
- Ordinaal
o Er is een rank order maar de afstanden zijn niet gelijk
§ Huisspin, wolfspin en vogelspin
- Kwantitatief: getal met betekenis
- Interval
o Verschil tussen waarde kan geïnterpreteerd en vergeleken worden maar
er is geen absoluut nulpunt
§ IQ-score, depressie score etc.
- Ratio
o Verschil tussen waarde kan geïnterpreteerd en vergeleken worden en er is
een absoluut nulpunt
§ Gewicht, lengte, salaris
,Een verdeling kan symmetrisch, rechts scheef en links scheef verdeeld zijn. Er zijn
verschillende maten om data samen te vatten:
- Gemiddelde (de som van alle scores gedeeld door het aantal scores)
- Mediaan (middelste waarde)
- Modus (meest voorkomende waarde)
Wanneer een verdeling symmetrisch is zijn het gemiddelde, de mediaan en modus
gelijk. Zodra variabele scheef verdeeld zijn gaan deze uit elkaar. Gemiddelde zullen
dan altijd hoger zijn dan mediaan en modus.
De variantie is de gemiddelde spreiding rond het gemiddelde. De
standaarddeviatie is de wortel van de variantie.
De z-score is het aantal standaarddeviaties dat een score verwijderd is van het
gemiddelde. Dit is een informatieve score omdat dit in verhouding is met het
gemiddelde en dus erg informaties is.
Een normale verdeling is een speciale symmetrische verdelen. Dit zal altijd
voorkomen wanneer je een steekproef trekt met een hoog aantal deelnemers. De IQ-
score is een voorbeeld van een normaal verdeelde score.
-/+ 1 SD van het gemiddelde = 68%
, Toetsende statistiek
Wat is het effect van kauwgom kauwen?
Nulhypothese (H0): er is geen verschil tussen de groep die wel kauwgom kauwt en
geen kauwgom kauwt.
Alternatieve hypothese (HA): er zit verschil tussen de groep die wel kauwgom
kauwt en geen kauwgom kauwt.
Door mensen random in te delen in verschillende groepen zorg je dat er sprake is van
twee equivalente groepen. Verschillen en overeenkomsten berusten daardoor op
toeval. De onafhankelijke variabele zou in dit geval kauwgom kauwen zijn. De
afhankelijke variabele zou in dit geval het testresultaat zijn.
Er is sprake van evidentie wanneer een waarde in de staart – dus minimaal twee
standaarddeviaties van het gemiddelde – van de normaalverdeling ligt. Op het
moment dat er sprake is van evidentie kan de nulhypothese verworpen worden.
Wanneer je onterecht een nulhypothese verwerpt wordt dit een type 1 fout
genoemd. De rechter bevindt onterecht iemand schuldig (hallucineren).
Wanneer je onterecht een nulhypothese behoudt wordt dit een type 2 fout genoemd.
De rechter spreekt onterecht iemand vrij (blind).
Om te bedenken of een uitslag wel of niet uitwijkend is heb je een niet een verdeling
van de populatie of steekproef nodig, maar een verdeling van alle gemiddeldes die we
zouden krijgen als we de test zouden herhalen. Dit wordt de
steekproevenverdeling genoemd. Je gaat er altijd vanuit dat deze normaal
verdeeld is.
De norm is een tweezijdige verdeling, tenzij voorafgaand al duidelijk is dat er sprake
is van een daling of vergroting