Chapter 2 – Everything you never wanted to know about statistics
2.2 bouwen van statistische modellen
Real world fenomenen: fenomenen waarbij we uitgaan van iets dat daadwerkelijk bestaat > bijvoorbeeld:
gedrag van afgestudeerde van een eindexamenfeestje > om dit fenomeen uit te leggen moet data vanuit de
echte wereld verzameld worden om hypotheses over dit fenomeen te kunnen testen. Om deze hypotheses te
testen moeten statistische modellen ontwikkeld worden.
Zodra een model gebouwd is kan het gebruikt worden om voorspellingen te doen > voorbeeld: de engineer kan
testen of de brug een sterke wind kan weerstaan door het model in een windtunnel te plaatsen > het is van
belang dat het model een accurate representatie is van de echte wereld.
Waarom bouwen we statistische modellen?
Statische modellen worden gebouwd om voorspellingen te doen hoe processen werken in bepaalde
condities > we kunnen alleen dingen afleiden over psychologische, maatschappelijke, biologische of
economische processen gebaseerd op de modellen die we bouwen.
Het statistische model dat gebouwd wordt moet de verzamelde/geobserveerde data zo goed mogelijk
representeren.
Fit = de mate waarin het statische model data die verzameld is representeert.
Het onderstaande figuur illustreert 3 modellen die gebouwd kunnen worden door de engineer om de brug in
de echte wereld te representeren.
2.3 populaties en steekproeven
We zijn geïnteresseerd in bevindingen die toepasbaar zijn op de gehele (liefst grote) populatie. Als men geen
toegang heeft tot data van elk lid van een populatie wordt er data vanuit een kleine groep van de populatie
getrokken > sample