OEF 58
%100 steekproefwaarden, 400 keer, volgens F(7,5 df)
simulatie = frnd(7, 5, 100, 400);
%Gemiddelde van elke steekproef
xbar = mean(simulatie);
%Histogram (normalization en pdf --> totale opp = 1)
histogram(xbar, 'Normalization', 'pdf')
hold on
%We maken een rij x_waarden aan met waarden op de X-as en een rij dichtheids_waarden met de
x_waarden = 0:0.05:4;
dichtheids_waarden = normpdf(x_waarden,5/3,sqrt(5/7)/3);
plot(x_waarden,dichtheids_waarden, 'r')
%De oorspronkelijke F-verdeling waaruit de steekproeven werden gesampled
plot(x_waarden,fpdf(x_waarden,7,5), 'g')
1
,OEF 59
A=[24, 19, 14, 10, 7, 5, 6, 8, 12, 16, 21, 27];
%Boxplot
boxplot(A);
Om na te gaan of de gegevens uit een normaalverdeelde populatie komen gebruiken we de
KolmogorovSmirnov (KS) test.
%Gemiddelde
gem = mean(A)
gem = 14.0833
%Standaardafwijking
sig = std(A)
sig = 7.3665
Eerst genereren we een distributie test_cdf met makedist. De argumenten kunnen we als volgt uitleggen:
'Normal' betekent dat we een normaalverdeling maken met parameters 'mu' en 'sigma'. In deze oefening
stellen we 'mu' en 'sigma' gelijk aan de respectivelijke, eerder berekende waarden gem en sig. Het object
test_cdf is de theoretische distributie waarmee de empirische distributie (die volgt uit de data) vergeleken
wordt tijdens het gebruik van de KS-test. De argumenten gebruikt bij het commando kstest zijn als volgt: A
zijn de empirische gegevens waarvan we de distributie willen controleren. Met 'CDF', test_cdf geven we de
1
,theoretische distributie mee, in dit geval een normaalverdeling met gemiddelde mu en standaardafwijking sig.
Het commando kstest geeft drie waarden terug: h, p en D. h is de uitkomst van de test met , betekent dat we
aanvaarden en betekent dat we verwerpen (en dus accepteren). Als het niet anders gespecifieerd wordt is de
alfa-waarde waarmee we werken steeds 0.05. De waarde p is het significantieniveau van de test en D is de KS-
test veranderlijke.
test_cdf = makedist('Normal','mu',gem,'sigma',sig);
[h,p, D] = kstest(A,'CDF',test_cdf)
h = logical
0
p = 0.9736
D = 0.1289
%h: hypothese aanvaarden (h=1) hypothese verwerpen (h=0)
%p: significantieniveau
%D: KS-test veranderlijke
%Hier is h=0 --> H0 aanvaarden, komt idd uit een normale verdeling (95%)
Ga na of de gegevens uit een normaal verdeelde populatie met gemiddeld 7 komen.
We herhalen de test maar stellen µ gelijk aan 7.
test_cdf = makedist('Normal','mu',7,'sigma',sig);
[h,p,D] = kstest(A,'CDF',test_cdf)
h = logical
1
p = 0.0351
D = 0.3930
%Hier is h=1 --> H0 verwerpen, komt niet uit een normale verdeling met µ=7
%(95%)
2
, OEF 60
A = [25, 50, 22, 10, 28, 95, 20, 14, 25, 30];
%Boxplot
boxplot(A);
Bepaal de uitschieters
%Bepalen van de kwartielen
p = 100*(0:0.25:1);
y = prctile(A,p);
z = [p; y]
z = 2×5
0 25 50 75 100
10 20 25 30 95
%Q1: 10 tot 20, Q2: 20 tot 25, Q3: 25 tot 30, Q4: 30 tot 95
%Een rechtse uitschieter ligt op meer dan 1.5*IQR van Q3 en een linkse uitschieter
%ligt op meer dan 1.5*IQR van Q1, IQR = Q3-Q1
%Rechtse uitschieters:
IQR = 30-20;
A>(1.5*IQR+30)
1