Statistiek 3 Software
H2: getting started with R
+ Optellen
- Aftrekken
= Is gelijk aan
* Vermenigvuldigen
/ Delen
^ OF ** Machtsverheffing
citation() Info over hoe citeren
-> OF <- OF = Value opslaan als variabele
‘=‘ heeft richting (bv. s=350 mr niet 350=s)
objects() OF ls() Welke variabelen al opgeslagen?
X<-c(y,z) Vector X aanmaken met elementen y en z
combine
X[1] OF X[c(1,2)] Enkel 1e (en 2e) element uit vector X halen
X[1]<-a Enkel 1e element in vector X veranderen naar a
c(1,2,3) OF c(1:3) Element 1 tot 3 uit vector halen
sqrt(c(x,y)) OF x^0.5 Vierkantswortel van X (en Y)
abs() Absolute waarde functie
length() Lengte, aantal elementen van vector
H3: more fun with R
help.request() Hulp vragen aan R
# Comment, tekst die R niet leest, enkel voor jezelf
x<-“a” OF x<-‘a’ Character string, tekst a opslaan als variabele
V<-c(“a”,”b”) Tekst opslaan als vector V
nchar() Telt aantal karakters waaruit string bestaat =>
aantal letters van woord(en)
== Equality operator, is gelijk aan => uitkomst is
TRUE of FALSE
=> assumptie dat vectoren even lang zijn
T OF TRUE OF F OF FALSE Logical values => niet ‘t’ of ‘f’
V<-c(TRUE, FALSE) Logical data opslaan als vector V
< OF > Minder dan OF meer dan
<= Minder dan of gelijk aan
>= Meer dan of gelijk aan
!= Niet gelijk aan
! Niet
| Of
& En
%in% Checkt per element van de ene vector of het ook
voorkomt in de andere vector checkt voor elke
waarde aan de linkerkant of deze wel/niet tussen
de waarden van de rechterkant zitten, positie
niet relevant TRUE of FALSE
class() High-level classificatie, bepaalt wat je wel/niet kan
doen met je data welke klasse is een variabele
mode() Welke soort informatie in variabele (text,
numeric), enkel simpele onderscheidingen
(minder belangrijk)
typeof() Low-level classificatie (minder belangrijk)
1
, H4 More on functions in R
round(x=, digits=2) Waarde X afronden tot 2 cijfers na de komma
default value = 0 dus geheel getal
log10() Logaritme met basis 10
log() Logaritme met basis e (Euler’s getal: e =
2.718282)
= natuurlijk logaritme
log2() Logaritme met basis 2 (kan met elk getal)
exp(x) x
ⅇ = exponentiation (bv. exp(6.908) = 1000.245)
floor() Naar beneden afronden
ceiling() Naar boven afronden
v[1:6] De eerste 6 waarden uit variabele v
mean() Gemiddelde berekenen
sum() Waarden optellen
cumsum() Cumulatieve som
length() Totale aantal observaties tellen, lengte vector
rep(x,y) y aantal keer het cijfer/woord x herhalen
rep(c(x,z),y) y aantal keer het cijfer/woord sequentie x z
herhalen
seq(from=1, to=7, by=3) Sequentie van 1 tot 7, per 3 (uitkomst: 1 4 7)
seq(from=1,to=7,length.o Sequentie van 1 tot 7, verdelen in 10 getallen
ut=10)
head() De eerste 6 elementen van een variabele printen
tail() De laatste 6 elementen van een variabele printen
max() Het maximum, het grootste cijfer
min() Het minimum, het kleinste cijfer
which() Input = vector van logicals
Output = de cases die TRUE zijn bv. which(x
> 10)
which.max() De hoeveelste waarde is de maximum?
which(x==max(x))
table() Frequentie tabel als 1 variabele dan tabulation,
als 2 variabelen dan cross-tabulation (meer
variabele kan ook)
tabulate() Low-level functie, input zijn numerieke vectoren
en output zijn frequenties (bv.
tabulate(1,2,2,3,1,1,5) 3 2 1 0 1)
xtabs() Cross tabulation (minder belangrijk)
ftable() NK
print() Displays, prints things
prop.table(table(x,y), X,Y = frequentie tabel van vectoren X en Y
margin =) OF table(x)/n Margin = voor welke dimensie je proporties wil
berekenen default: totaal gelijk aan 1
margin = 1: proporties per rij (rij = 1)
margin = 2: proporties per kolom (kolom = 1)
paste(…, sep = , collapse … = input, strings die je samen wil plakken (per
=) element)
sep = string die aangeeft welke characters als
separators gebruikt moeten worden, om de
originele strings te splitsen
default: sep = ” “ (spatie) tussen woorden
2