Opgave 1
Vraag (regulier): Internetconnecties
Bandbreedte van Internetconnecties verwijst naar de maximale hoeveelheid
gegevens die een verbinding kan verwerken op een bepaald moment. Hoe meer
gegevensverkeer op het Internet, des te beperkter de bandbreedte, en des te
trager de verbinding. Om deze reden houden netwerkaanbieders de benutting
van hun netwerk en het aantal verbindingen met hun servers zorgvuldig in de
gaten. Een voorbeeld van deze monitoring is het waargenomen aantal
connecties per minuut dat wordt onderhouden door een bepaalde server
opgeslagen in R's datasetWWWusage.
Dataset WWWusage is een zogenaamd time series object, dat in R beschikbaar
wordt gemaakt met functie data(). Informatie over deze tijdreeks kan worden
verkregen met functie help(). Nadat het object beschikbaar is gemaakt, wordt
het omgezet naar een numerieke vector users_www met functie as.numeric(), en
vervolgens naar een dataframe dfUsers met functie data.frame(). Genoemde
instructies zien er in code uit als volgt:
Open een nieuwe R/RStudio-session, en maak dataframe dfUsers zoals
geïllustreerd. Gebruik dataframe dfUsers of vector users_www om de
onderstaande vragen te beantwoorden; alle antwoorden zijn gebaseerd op het
programma R.
Opmerking: hetzelfde gegevensbestand dfUsers is beschikbaar als
WWWusage.csv en WWWusage.rda in de gedeelde folder in de toetsomgeving
voor de duur van de toets, voor het geval dat de eerder beschreven functie
data() niet de gewenste gegevens beschikbaar maakt.
(a)
Samenvattingen van statistische gegevens kunnen maatstaven van centrale en
niet-centrale tendentie bevatten, evenals spreidingsmaatstaven. Op z'n minst,
bevatten deze statistische samenvattingen een maatstaf van locatie en een
maatstaf van spreiding. Deze sub-vraag gaat over de berekening van enkele van
deze maatstaven.
1
,1a
Bepaal de mediaan van het aantal Internetconnecties per minuut (users_www; in
3 decimalen)
138.5
> median(WWWusage)
138.5
1b
Bepaal het bereik van het aantal Internetconnecties per minuut (users_www; in 3
decimalen).
145.0
> max(WWWusage)
228
> min(WWWusage)
83
228-83 = 145.0
1c
Aangezien de dynamiek van het aantal Internetconnecties centraal staat in het
onderzoek, is het van belang om inzicht te hebben in de groeisnelheid (growth
rate) waarmee gebruikers verbinding maken met de server. Bereken de
samengestelde gemiddelde groeisnelheid (growth rate) van het aantal
connecties over de waarnemingsperiode (in 3 decimalen).
0.009
> begin_value <- WWWusage[1]
> end_value <- WWWusage[length(WWWusage)]
> n_periods <- length(WWWusage)-1
> (end_value/begin_value)^(1/n_periods)-1
[1] 0.009298426
2
, (b)
Een ander aspect van het onderzoek is de variatie van het aantal
Internetconnecties per minuut (users_www) dat door de server wordt
onderhouden gedurende de waarnemingsperiode.
1d
Bereken de variantie van het aantal Internetconnecties per minuut (users_www;
in 3 decimalen).
1599.953
> var(WWWusage)
[1] 1599.953
1e
Bepaal het bereik van een 96%-betrouwbaarheidsintervalschatting van de
variantie van het aantal verbonden gebruikers per minuut in de populatie
(users_www; in 3 decimalen).
972.707
users_www <- as.numeric(WWWusage)
> s2 <- var(users_www)
> n <- length(users_www)
>n
[1] 100
> alpha <- 0.04
> chi2_upper <- qchisq(alpha / 2, df = n - 1)
> chi2_lower <- qchisq(1 - alpha / 2, df = n - 1)
> ci_lower <- (n - 1) * s2 / chi2_lower
> ci_upper <- (n - 1) * s2 / chi2_upper
> ci_exact <- (ci_lower + ci_upper) / 2
> list(lower = round(ci_lower, 3), upper = round(ci_upper, 3), exact =
round(ci_exact, 3))
$upper
3