Samenvatting

Samenvatting HCO9, handling violations of assumptions

Name: HCO9, handling violations of assumptions
SKU: doc_644332
Rating: 5.00 (1 reviews)
Author: brittheijmans

Beoordeling

5.0

(1)

Verkocht

Pagina's

Geüpload op

25-01-2020

Geschreven in

2019/2020

Dit is een uitgebreide samenvatting van HCO9 van Rutger Hermsen waarin gekeken wordt wat je moet doen als je niet voldoet aan aannames van een toets. Onderwerpen die aan bod komen zijn: parametrische toets, data transformatie, niet-parametrische toets, log transformatie, concave functie, convexe functie, tekentoets, sign test, wilcoxon's signed rank test, (), mann-whitney U-test, Kruskal-Wallis toets, (), Dunn's toets, permutatie toets, sample(), for loop, if statement etc.

Meer zien Lees minder

Instelling

Vak

Voorbeeld van de inhoud

HCO9, handling violations of assumptions
Parametrische toetsen, maken aannames over de verdeling van je variabele. Deze aanname is echter
niet altijd correct en in dat geval zijn er paar andere opties:
- Data transformatie, als je een bepaalde transformatie uitvoert op je data kan het de
normaliteit en/of homogeniteit van de verdeling verbeterd wordt.
- Niet-parametrische toets, is een toets die minder strenge aannames maakt over de
verdelingen. Dit gaat wel ten koste van de kracht van je toets. Dat wil zeggen dat je minder
snel in staat zult zijn om je nulhypothese te verwerpen.
- Computer intensieve toetsen, de toetsen die tot nu behandeld zijn, zijn allemaal rond 1930
bedacht toen er nog geen krachtige rekenmachines waren. Tegenwoordig kunnen we echter
al moeilijke berekeningen oplossen met onze telefoon. Voorbeelden van computer
intensieve testen zijn bootstrapping en permutatie testen. Deze toetsen maken ook
aannames, maar deze zijn meestal niet zo streng en relatief robuust.
- Generalized linear models, zijn niet hetzelfde als linear models (lm())! Generalized linear
models zijn veel breder toepasbaar, maar dit komt pas in week 9 v/d cursus aan bod.
Data transformatie, transformeert elke meting door er dezelfde wiskundige formule op toe te
passen. Je doel hierbij is om een transformatie te vinden die ervoor zorgt dat je data beter aansluit
op de assumpties van een toets die je uit wil voeren. Meestal wil je de normaliteit en/of
homogeniteit (variantie) verbeteren van je groepen.
Voorbeeld data transformatie, rechts zie je data weergegeven
die right-skewed is. Dit zie je meteen als je boxplots bekijkt. Zo
ligt de mediaan niet in het midden van de box en heb je aan
bovenkant outliers. Ook is bij alle groepen de bovenste
staart/whisker een stuk langer. Je data is dus niet normaal
verdeeld, waardoor je geen ANOVA uit kan voeren. Toch lijkt er
een verband te zijn, want het gemiddelde wordt steeds hoger.
Als het gemiddelde van een variatie hoger is, heb je ook vaak
een hogere variatie. Dit is ook een probleem bij ANOVA,
aangezien je varianties daarbij hetzelfde moeten zijn. Je kan
naar de diagnostische plotjes kijken om de aannames nog beter
te toetsen. Deze plotjes bevestigen hetgeen wat al gezegd is: de
data is scheef en niet homogeen. In dit geval ligt de oplossing in
een log transformatie. In R kan je heel gemakkelijk
transformaties uitvoeren, aangezien R de berekening op alle
getallen in een vector toe zal passen:

Rechtsonder is te zien hoe de getransformeerde data eruitziet.
Je ziet dat de verdeling niet meer scheef is en dat de standaard
deviaties veel dichter bij elkaar liggen. Verder bevestigt de
Levene’s test dat je data homogeen is. Je kan ook nog de
diagnostische plotjes bekijken ná de transformatie (↓) en deze
geven ook aan dat
je data mooi
normaal verdeeld
en homogeen is. Je
mag nu dus wel
ANOVA uitvoeren.
Je ziet op de

, volgende pagina de ANOVA tabel weergegeven. De P-
waarde is niet kleiner dan 0.05 en je hoeft dus geen
paarsgewijze vergelijkingen uit te voeren (summary()).
Conclusie bij datatransformatie, een nadeel aan het
gebruiken van datatransformaties is dat je nulhypothese
hierdoor verandert. Zo zou je nulhypothese voor ANOVA als volgt zijn:
𝐻0 : ℎ𝑒𝑡 𝑔𝑒𝑚𝑖𝑑𝑑𝑒𝑙𝑑𝑒 𝑣𝑎𝑛 𝑑𝑒 𝑔𝑒𝑡𝑟𝑎𝑛𝑠𝑓𝑜𝑟𝑚𝑒𝑒𝑟𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑒𝑙𝑒 𝑖𝑠 𝑣𝑜𝑜𝑟 𝑎𝑙𝑙𝑒 𝑔𝑟𝑜𝑒𝑝𝑒𝑛 𝑔𝑒𝑙𝑖𝑗𝑘
bijvoorbeeld 𝐻0 : 𝑚𝑒𝑎𝑛(ln(𝑋1 )) = 𝑚𝑒𝑎𝑛(ln(𝑋2 )) =..
Dit is niet dezelfde nulhypothese die gebruikt voor een ANOVA zonder transformaties waarbij je
simpelweg zegt dat alle gemiddeldes hetzelfde zijn. Dat komt omdat 𝑚𝑒𝑎𝑛(ln(𝑌)) ≠ ln(𝑚𝑒𝑎𝑛(𝑌)).
In het algemeen is het gemiddelde van een bepaalde functie van een variabele niet hetzelfde als de
functie van het gemiddelde van deze variabele. Dat zie je het volgende voorbeeld:
- De variabele is als volgt: 𝑋 = 1,2,3
- Het gemiddelde van deze variabele is: 𝑋̅ = 2
12 +22 +32 14
- Het gemiddelde van de getransformeerde data is: ̅̅̅̅𝑋2 = =
3 3
- Het uitvoeren van de transformatie op het gemiddelde geeft: 𝑋̅ 2 = 22 = 4
14
- 3
≠ 4 dus het klopt
Je toetst dus een andere hypothese, maar in veel gevallen is dat niet zo belangrijk voor de
biologische conclusie. Als er iets verandert is, heb je al laten zien dat er een effect is. Ben er echter
van bewust dat het een verschil kan maken!
Veel gebruikte transformaties, hieronder zie je een paar transformaties die vaak gebruikt worden:
- Log transformatie (𝒀′ = 𝐥𝐧(𝒀)), als je waardes hebt die negatief zijn of gelijk zijn 0 moet je
nog een extra aanpassing maken, want de log van een negatief getal of 0 werkt niet. In dat
geval gebruik je 𝑌 ′ = ln(𝑌 + 𝑐) waarbij c constant is.
- Arcsine transformatie (𝒑′ = 𝒂𝒓𝒄𝒔𝒊𝒏(√𝒑)), als je proporties wil toetsen, maar je aannames
niet voldaan worden, kan je dat vaak oplossen door de arcsine van de wortel te nemen.
- Exponentiële transformatie (𝒀′ = 𝒆𝒙𝒑(𝒀)), dit is precies het omgekeerde van de log
transformatie. Vaak is een exponentiële transformatie nuttig als je dat left-skewed is.
- Er zijn nog veel meer mogelijke transformatie, zie daarvoor W&S.
Concave VS convexe functies, afhankelijk van je data moet je hem transformeren
met een concave of convexe functie:
- Concave functie, als je een concave functie gebruikt om te transformeren,
zal je voor kleine x’en een grote verandering krijgen in y. Bij grote x’en
verandert y juist minder snel. Rechts zie je een concave functie
weergegeven en voorbeelden van functies die op deze manier verlopen
zijn log en wortel functies. Deze gebruik je op data die rechtsscheef is. Je
ziet rechts aangegeven hoe right-skewed data verandert als je er een
concave functie op loslaat.
- Convexe functie, als je een convexe functie gebruikt om te
transformeren worden juist grote waarden van x uit elkaar
getrokken en kleine waarden niet. Voorbeelden van convexe
functies zijn exponentiële en kwadraat functies. Deze pas je toe op data die
linksscheef is.
Je moet dus eerst naar de verdeling van je data kijken om te begrijpen wat
voor transformatie je toe moet passen.
Voor- en nadelen transformeren, het grote voordeel is dat je door een
transformatie een normale parametrische toets uit kan voeren met veel
kracht. Het nadeel is dat je nulhypothese hierbij ook getransformeerd wordt en
dat betekent dat je dus een andere hypothese aan het toetsen bent.

Meld schending auteursrecht

Geschreven voor

Instelling: Universiteit Utrecht (UU)
Studie: Biologie
Vak: Voortgezette statistiek en R

Alle documenten voor dit vak (21)

Documentinformatie

Geüpload op: 25 januari 2020
Bestand laatst geupdate op: 29 januari 2020
Aantal pagina's: 7
Geschreven in: 2019/2020
Type: SAMENVATTING

Onderwerpen

aanname
parametrische toets
data transformatie
niet parametrische toets
log transformatie
concave functie
convexe functie
tekentoets
sign test
mann whitney u
wilcoxons signed rank test
wilcoxtest

$4.78

Krijg toegang tot het volledige document:

Geschreven door studenten die geslaagd zijn

Direct beschikbaar na je betaling

Online lezen of als PDF

Maak kennis met de verkoper

brittheijmans

4.4

(533)

Beoordelingen van geverifieerde kopers

Alle reviews worden weergegeven

LaureSchippers Moleculaire Levenswetenschappen · 167 beoordelingen

4 jaar geleden

5.0

1 beoordelingen

Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

brittheijmans Universiteit Utrecht

Bekijk profiel

Volgen

Verkocht

635

Lid sinds

8 jaar

Aantal volgers

290

Documenten

381

Laatst verkocht

2 maanden geleden

Mijn samenvattingen bevatten altijd kleurtjes om de belangrijke begrippen aan te duiden en verder gebruik ik veel figuren om zaken uit te leggen. Heb je echter toch nog vragen, dan kan je altijd contact met met opnemen. Ik heb eerst 3 jaar biologie gestudeerd en ben nu bezig met een master om zowel arts als klinisch onderzoeker te worden.

4.4

533 beoordelingen

308

149

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper brittheijmans. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor $4.78. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews) Afgelopen 30 dagen zijn er 49904 samenvattingen verkocht Opgericht in 2010, al 16 jaar dé plek om samenvattingen te kopen

Samenvatting HCO9, handling violations of assumptions

Voorbeeld van de inhoud

Geschreven voor

Documentinformatie

Onderwerpen

Beoordelingen van geverifieerde kopers

Maak kennis met de verkoper

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Niet tevreden? Kies een ander document

Betaal zoals je wilt, start meteen met leren

Bezig met je bronvermelding?

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Tevredenheidsgarantie: hoe werkt dat?

Van wie koop ik deze samenvatting?

Zit ik meteen vast aan een abonnement?

Is Stuvia te vertrouwen?