H1: NEYMAN, PEARSON AND HYPOTHESIS TESTING
In dit hoofdstuk kijken we naar de standaard logica van statistische inferentie. Dat is de logica
onderliggend aan alle statistiek die je ziet in wetenschappelijke artikelen.
De Neyman-Pearson benadering, wordt vaak gebruikt in introducerende statistiek cursussen; deze
benadering is controversieel, wordt vaak aangevallen (en verdedigd) en nog vaker verkeerd
begrepen door ervaren onderzoekers.
Fisher, Neyman and Pearson
Fisher ontwikkelde het idee van het bekijken van de p-waarde. Hij ontwikkelde de nulhypothese en
significantie. Net als de random toewijzing aan condities en de analyse van variantie.
Neyman en Pearson gaven een logische basis voor het idee van hypothesetoetsing.
Probability
De goede manier om kansen te interpreteren blijft controversieel. Interpretaties starten vaak met
een set van axioma die kansen moeten volgen; Kolmogorov kwam met het volgende;
1. P(A)≥0, alle kansen moeten 0 of groter zijn
2. Als S refereert naar een gebeurtenis die voorkomt dan P(S)=1.
3. P(A of B) = P(A) + P(B), als A en B gelijk exclusief zijn; als ze niet samen kunnen gebeuren.
4. P(A en B) = P(A) *P(BIA), waar P(BIA) is de kans op B gegeven A
Onderscheid tussen twee soorten interpretaties van kansen;
I. Subjectieve kansen = de mate van een bepaalde overtuiging.
II. Objectieve kansen = de kansen in de echte wereld.
Kansen worden benaderd aan de hand van het bestuderen van de wereld; niet door middel van
reflecteren over wat we weten, of in hoeverre we iets geloven.
De meest invloedrijke objectieve interpretatie van kanse is de long-run relative frequency
interpretation van Von Mises; een kans is een relatieve frequentie, die moet refereren aan een
hypothetisch oneindige herhaling van gebeurtenissen. De hypothetische oneindige set van
gebeurtenissen wordt de reference class of collective genoemd. Kansen zijn van toepassing op een
collectief en niet op een enkele gebeurtenis. Ook zijn ze niet van toepassing op de waarheid van de
hypothese. Een hypothese is waar of onwaar.
Data and Hypotheses
Je kan spreken over P(D|H), ‘de kans dat je deze data vindt, gegeven de hypothese’. Je kan niet
spreken over P(H|D); er is geen collectief, omdat een nulhypothese simpelweg waar, of onwaar is.
denk aan haaien voorbeeld op blz. 4.
als je P(D|H) weet, weet je niet wat P(H|D) is, hier zijn twee redenen voor;
1. Omgekeerde conditionele kansen kunnen hele andere waarden hebben.
2. Het is zinloos om een objectieve kans toe te schrijven aan een hypothese
Hypothesis Testing: α
Neyman en Pearson werkten volgens een objectieve, relatieve frequentie interpretatie van kansen;
de statistiek vertelt ons niet hoe erg we een bepaalde hypothese moeten geloven. Wat we wel
kunnen doen is een bepaalde beslisregel opstellen voor bepaald gedrag-accepteren of verwerpen