Vectoren
Maak een vector met de waarden 5 t/m 20 met stapgrootte 3: seq(5, 20, by = 3)
Wat is het verschil tussen : en seq()?: maakt alleen stappen van 1, terwijl seq() flexibeler
is (bijv. andere stapgroottes).
Gebruik rep() om (1,1,2,2,3,3) te maken: rep(1:3, each = 2)
Data types & checks
Wat is het verschil tussen numeric en character?: Numeric bevat getallen, character
bevat tekst.
Wat doet class()?: Geeft het type van een object.
§ numeric → decimal numbers (default) 3.14
§ Integer → whole numbers 5L
§ character → text "hello"
§ logical → TRUE / FALSE
§ complex → complex numbers 1 + 2i
§ raw → bytes (rarely used)
Selectie
Wat is het verschil tussen d[ ] en d[[ ]]?: d[ ] geeft een data frame, d[[ ]] geeft de inhoud
(bijv. vector).
Wat is het verschil tussen d$kolom en d["kolom"]? $ geeft een vector, ["kolom"] geeft
een data frame.
Selecteer rij 2 en 4: d[c(2,4), ]
Selecteer score ≥ 8 en leeftijd > 20: d[d$score >= 8 & d$leeftijd > 20, ]
Sorteer op score: d[order(d$score), ]
Selecteer rijen met NA in score: d[is.na(d$score), ]
Selecteer alleen score van mensen ≥ 25 jaar: d[d$leeftijd >= 25, "score"]
Selecteer kolommen leeftijd en score d[c("leeftijd", "score")]
, Logische functies en samenvattende statistiek
Wat is c(1,2,3) > 2? FALSE FALSE TRUE
Wat doet is.na()? Controleert op missende waarden.
Bv: Bereken het aantal missende waarden: sum(is.na(x))
Wat betekent !TRUE? FALSE
Tel aantal per geslacht: table(d$geslacht)
Wat is het verschil tussen sum() en length()? sum() telt de waarden op, length() telt het
aantal elementen.
sum(c(TRUE, FALSE, TRUE)) = 2 (omdat TRUE = 1 en FALSE = 0)
length(c(1,2,3,NA)) = 4 (NA telt gewoon mee)
mean(c(1,2,NA,4)) = NA
mean(c(1,2,NA,4), na.rm=TRUE) = 2.33
Wat doet de functie range()? Geeft het minimum en maximum van een vector.
Bereken het gemiddelde van alleen waarden groter dan 3: mean(x[x > 3])
Data manipulatie
Wat is een data frame? Een tabel met rijen (observaties) en kolommen (variabelen).
à d <- data.frame(leeftijd, score)
Wat doet factor()? Zet data om naar categorische variabele.
Verschil list en data frame? Data frame: kolommen gelijke lengte, list: alles mogelijk.
Voeg kolom geslaagd toe (score ≥ 8) d$geslaagd <- d$score >= 8
Coercion is het automatisch omzetten van een datatype naar een ander datatype door R.
R zet altijd om naar het “meest flexibele type” logical → numeric → character
Zonder quotes → getal (numeric/integer)
Met quotes → tekst (character)
Wat geeft dim() terug? Aantal rijen en kolommen.
Verschil vector en matrix? Matrix heeft dimensies, vector niet.