Assignment 5: Machine Learning (Weka)
➢ Train a tree on the data from the golf playing example Download golf playing
example mentioned in the slides to make sure you can reconstruct the
decision tree from the slides (don't forget to select that you're loading a csv
file). Pick the J48 algorithm which is a slight extension of ID3. Select the “use
training set” test option. Visualise the tree to verify it's the same as on the
slides.
○ Make sure you understand the confusion matrix given by Weka.
■ I will add a ss of the confusion matrix and maybe you can add a
little paragraph discussing it and explain it, to show that you
‘understand’ it.
=== Summary ===
Correctly Classified Instances 14 100 %
Incorrectly Classified Instances 0 0 %
Kappa statistic 1
Mean absolute error 0
Root mean squared error 0
Relative absolute error 0 %
Root relative squared error 0 %
Total Number of Instances 14
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
1,000 0,000 1,000 1,000 1,000 1,000 1,000 1,000 No
A confusion matrix is used in classification problems to evaluate the effectiveness of a machine
learning model. It compares the predicted classifications to the actual classifications, allowing us to
see how well the model is performing.
➢ Accuracy: The proportion of correctly classified instances out of the total.
(5+9) / (5+0+0+9) = 14/14 = 100%.
➢ Precision: The proportion of true positives out of the total predicted positives.
For class "Yes", it is 9 / (9+0) = 100%.
➢ Recall (Sensitivity or True Positive Rate): The proportion of true positives out of the actual
positives.
For class "Yes", it is 9 / (9+0) = 100%.
➢ Specificity (True Negative Rate): The proportion of true negatives out of the actual negatives.
For class "No", it is 5 / (5+0) = 100%.
The confusion matrix shows that the classifier has performed perfectly on the given dataset,
correctly classifying all instances without any errors.
➢ Use the medical heart example data Download medical heart example data to
train a decision tree. Again, visualise the tree.
Material to hand in:
○ A screenshot of your decision tree.
, === Run information ===
Scheme: weka.classifiers.trees.J48 -C 0.25 -M 2
Relation: heart
Instances: 918
Attributes: 12
Age
Sex
ChestPainType
RestingBP
Cholesterol
FastingBS
RestingECG
MaxHR
ExerciseAngina
Oldpeak
ST_Slope
HeartDisease
Test mode: evaluate on training data
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur famkebrieffies. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €7,16. Vous n'êtes lié à rien après votre achat.