DEELTENTAMEN 4
18-1-2016
H10: BAYES AND THE PROBABILITY OF HYPOTHESES
Klassieke statistieken (de Neyman-Pearson) kunnen iets vertellen over de long-run relatieve
frequenties van verschillende typen van error; vertellen niet de kans dat een hypothese waar is.
Een alternatieve benadering (Bayesiaanse) maakt gebruik van mensen hun natuurlijke intuïtie;
subjectieve kans, dit is de basis voor de Bayesiaanse statistiek.
Subjective Probability
Subjectieve kansen= de overtuiging die we hebben over een bepaalde hypothese.
Gegeven deze betekenis, zijn kansen in het hoofd en niet in de wereld.
Het probleem bij het gebruik van subjectieve kansen is hoe je een nummer toeschrijft aan
hoe waarschijnlijk je een propositie vindt.
De initiële persoonlijke kans die je toeschrijft aan een theorie is geheel je eigen keus
Soms is het handig de overtuiging over je hypothese op te schrijven in termen van odds;
odds(theorie is waar) = kans(theorie is waar) / kans(theorie is onwaar)
Bayes Theorem
Bayes bedacht een benadering om de kans op een hypothese gegeven de data, P (H|D), te
berekenen.
P(H|D) = P(D|H) * P(H)
Deze vergelijking bestaat uit verschillende onderdelen; de prior, posterior en likelihood.
o Prior = P(H); dit staat voor hoe waarschijnlijk je de hypothese achtte, voor het
verzamelen van de data.
o Posterior = P(H|D); dit staat voor hoe waarschijnlijk de hypothese is, gegeven de
data.
o Likelihood = P(D|H); dit staat voor hoe waarschijnlijk de data is, gegeven de
hypothese.
je posterior is proportioneel aan de likelihood keer de prior.
je bent telkens je persoonlijke overtuiging in een hypothese aan het updaten door nieuw
verkregen data.
The Likelihood
Met de likelihood wordt P(D|H) bedoeld; de kans op de data, gegeven de hypothese.
o Volgens de Bayesiaanse theorie; alle ondersteuning voor een hypothese verkregen
door de data wordt verkregen door de likelihood. De likelihood alles wat je moet
weten over de data om je persoonlijke overtuiging over een hypothese te updaten.
Dit wordt ook wel het likelihood-principle genoemd; dit principe geldt niet in
de klassieke Neyman-Pearson methode.
Berekenen van de ‘likelihood’ door;
P(D|H) = P(aantal succes | base rate) = base rateaantal succes