R Studio
- File > New File > R Markdown
- Het schrijven tussen *test* of _test_ maakt tekst cursief.
- Het schrijven tussen **test** of __test__ maakt tekst vet.
- $\mu$ of $\sigma^2$ geven μ en σ 2
- Code > Insert Chunk
- Plot(naam datafile)
- Alleen code zichtbaar:
```{r results=”hide”}
- Alleen output zichtbaar:
```{r echo=FALSE}
- Berekening:
2 * 273 = `r 2 * 273`
- Hulp: in een chunk;
help(test)
- Getal toewijzen aan variabele:
variabele <- 2 + 2
- Vector <- c(3, 4, 5) of vector <- c(“ma”, “di”, “woe”)
- Lijst <- list(element 1 = c(“ma”, “di”, “woe”), element 2 = c(3, 4, 5),
element 3 = -8,5)
- Data lezen:
test.data <- read.csv("Coffee.csv")
- Output data weergeven:
str(test.data)
- Variabele selecteren:
test.data$naam variabele
- Eerste vier of laatste drie van een dataset:
youtubedata <- read.csv("youtubelab1.csv", stringsAsFactors =
TRUE)
tail(youtubedata, n = 3)
head(youtubedata, n = 4)
- Levels:
C(levels(youtubedata$category_name), “violence”)
- Factor:
youtubedata$category_name <-
factor(youtubedata$category_name)
- Variabele title type character:
youtubedata$title <- as.character(youtubedata$title)
- Dataframe in RStudio laden:
testdata <- read.csv(“naam bestand”, stringsAsFactors = TRUE)
- Variabele uit dataframe halen:
testdata$naam variabele
- Totaal bereken gekozen variabelen:
sum(testdata$naam variabele)
- Gemiddelde bereken gekozen variabelen:
mean(testdata$naam variabele)
- Standaardafwijking bereken gekozen variabelen:
sd(testdata$naam variabele)
, - Mediaan bereken gekozen variabelen:
median(testdata$naam variabele)
- Variantie berekenen gekozen variabele:
var(testdata$naam variabele)
- Percentielen bereken gekozen variabelen:
quantile(testdata$naam variabele, probs = c(0.3333, 0.5, 0.6667))
- Minimum berekenen gekozen variabele:
min(testdata$naam variabele)
- Maximum berekenen gekozen variabele:
max(testdata$naam variabele)
- Alles van een gekozen variabele berekenen:
summary(testdata$naam variabele)
- 1 variabele uit dataframe halen:
testdata$naam variabele[getal]
- Reeks variabelen uit dataframe halen:
testdata$naam variabele[getal:getal]
- Aantal variabelen uit dataframe halen:
testdata$naam variabele[getal, getal, getal]
- Variabelen vinden onder een voorwaarde:
testdata$naam variabele[ which(testdata$naam variabele >=
getal)]
- Variabelen vinden tussen twee voorwaardes:
testdata$naam variabele[ which((testdata$naam variabele >=
getal) & (testdata$naam variabele <= getal))]
- Waarnemingen dataframe selecteren:
testdata[ which (testdata$naam variabele >= getal) , ]
subset(testdata, naam variabele >= getal)
- Nieuwe variabele aanmaken:
testdata$naam nieuwe variabele <-
testdata$naam variabele / testdata$naam variabele
- NA uit gegevens weglaten:
sum (testdata$naam variabele, na.rm = TRUE)
- Kruistabel twee variabelen:
Table(testdata$naam variabele, testdata$naam variabele)
- Aantal rijen in een dataframe:
nrow(dataframe)
- Percentages van aantallen:
100 * summary(testdata$naam variabele) / nrow(dataframe)
- Gemiddelde van twee variabelen:
tapply(testdata$naam variabele 1, testdata$naam variabele 2,
mean)
- Steekproef zonder terugleggen:
sample(1:6, size = 2) geeft je twee random getallen tussen de 1 en
6
- Steekproef met terugleggen:
sample(1:6, size = 7, replace = TRUE) geeft je 7 random getallen
met herhaling mogelijk.
- Steekproef uit dataframe:
nr_obs <- nrow(my_testdata)
my_subsample <-
- File > New File > R Markdown
- Het schrijven tussen *test* of _test_ maakt tekst cursief.
- Het schrijven tussen **test** of __test__ maakt tekst vet.
- $\mu$ of $\sigma^2$ geven μ en σ 2
- Code > Insert Chunk
- Plot(naam datafile)
- Alleen code zichtbaar:
```{r results=”hide”}
- Alleen output zichtbaar:
```{r echo=FALSE}
- Berekening:
2 * 273 = `r 2 * 273`
- Hulp: in een chunk;
help(test)
- Getal toewijzen aan variabele:
variabele <- 2 + 2
- Vector <- c(3, 4, 5) of vector <- c(“ma”, “di”, “woe”)
- Lijst <- list(element 1 = c(“ma”, “di”, “woe”), element 2 = c(3, 4, 5),
element 3 = -8,5)
- Data lezen:
test.data <- read.csv("Coffee.csv")
- Output data weergeven:
str(test.data)
- Variabele selecteren:
test.data$naam variabele
- Eerste vier of laatste drie van een dataset:
youtubedata <- read.csv("youtubelab1.csv", stringsAsFactors =
TRUE)
tail(youtubedata, n = 3)
head(youtubedata, n = 4)
- Levels:
C(levels(youtubedata$category_name), “violence”)
- Factor:
youtubedata$category_name <-
factor(youtubedata$category_name)
- Variabele title type character:
youtubedata$title <- as.character(youtubedata$title)
- Dataframe in RStudio laden:
testdata <- read.csv(“naam bestand”, stringsAsFactors = TRUE)
- Variabele uit dataframe halen:
testdata$naam variabele
- Totaal bereken gekozen variabelen:
sum(testdata$naam variabele)
- Gemiddelde bereken gekozen variabelen:
mean(testdata$naam variabele)
- Standaardafwijking bereken gekozen variabelen:
sd(testdata$naam variabele)
, - Mediaan bereken gekozen variabelen:
median(testdata$naam variabele)
- Variantie berekenen gekozen variabele:
var(testdata$naam variabele)
- Percentielen bereken gekozen variabelen:
quantile(testdata$naam variabele, probs = c(0.3333, 0.5, 0.6667))
- Minimum berekenen gekozen variabele:
min(testdata$naam variabele)
- Maximum berekenen gekozen variabele:
max(testdata$naam variabele)
- Alles van een gekozen variabele berekenen:
summary(testdata$naam variabele)
- 1 variabele uit dataframe halen:
testdata$naam variabele[getal]
- Reeks variabelen uit dataframe halen:
testdata$naam variabele[getal:getal]
- Aantal variabelen uit dataframe halen:
testdata$naam variabele[getal, getal, getal]
- Variabelen vinden onder een voorwaarde:
testdata$naam variabele[ which(testdata$naam variabele >=
getal)]
- Variabelen vinden tussen twee voorwaardes:
testdata$naam variabele[ which((testdata$naam variabele >=
getal) & (testdata$naam variabele <= getal))]
- Waarnemingen dataframe selecteren:
testdata[ which (testdata$naam variabele >= getal) , ]
subset(testdata, naam variabele >= getal)
- Nieuwe variabele aanmaken:
testdata$naam nieuwe variabele <-
testdata$naam variabele / testdata$naam variabele
- NA uit gegevens weglaten:
sum (testdata$naam variabele, na.rm = TRUE)
- Kruistabel twee variabelen:
Table(testdata$naam variabele, testdata$naam variabele)
- Aantal rijen in een dataframe:
nrow(dataframe)
- Percentages van aantallen:
100 * summary(testdata$naam variabele) / nrow(dataframe)
- Gemiddelde van twee variabelen:
tapply(testdata$naam variabele 1, testdata$naam variabele 2,
mean)
- Steekproef zonder terugleggen:
sample(1:6, size = 2) geeft je twee random getallen tussen de 1 en
6
- Steekproef met terugleggen:
sample(1:6, size = 7, replace = TRUE) geeft je 7 random getallen
met herhaling mogelijk.
- Steekproef uit dataframe:
nr_obs <- nrow(my_testdata)
my_subsample <-