Analisis Model Klasifikasi Penyakit Jantung dengan Decision Tree C4.5 Berdasarkan Pendekatan Sentralisasi dan Federated Learning pada Dataset UCI
Abstract
Penyakit jantung merupakan penyebab utama kematian global dengan kontribusi sekitar 17,9 juta atau sekitar 32% kematian per tahun. Penelitian ini bertujuan mengembangkan model klasifikasi penyakit jantung menggunakan algoritma Decision Tree C4.5 berdasarkan tiga atribut utama: chest pain (cp), usia (age), dan kadar kolesterol (chol) dari dataset Heart Disease UCI. Metodologi penelitian meliputi preprocessing data, pembagian dataset menjadi 70-80% data latih dan 20-30% data uji, perhitungan entropy dan information gain, serta pembentukan pohon keputusan menggunakan algoritma C4.5. Hasil penelitian menunjukkan bahwa atribut chest pain (cp) menjadi simpul akar yang paling informatif dalam klasifikasi, diikuti oleh usia dan kadar kolesterol sebagai pembeda lanjutan.
References
Chicco, D., & Jurman, G. (2020). Machine learning can predict survival of patients with heart failure from serum creatinine and ejection fraction alone. BMC Medical Informatics and Decision Making, 20(1), 1–16. https://bmcmedinformdecismak.biomedcentral.com/articles/10.1186/s12911-020-1023-5
Fais, M. A., Revano, M., Lubis, A., Aulia, A., & Syafitri, I. (2023). Implementasi algoritma decision tree untuk klasifikasi serangan jantung. Jurnal Sistem Informasi dan Ilmu Komputer. https://www.semanticscholar.org/paper/Implementasi-Algoritma-Decision-Tree-untuk-Serangan-Fais-Revano/412380172075501676e46c2a4baebd78f31f3696
García, D., Luengo, J., & Herrera, F. (2016). Data preprocessing in data mining. Springer. https://digibug.ugr.es/bitstream/handle/10481/99405/2020_Book_BigDataPreprocessing.pdf
Gunawan, I. M. A. O., Saraswati, I. D. A., Agung, I. D. G. R., & Putra, I. P. E. (2023). Klasifikasi penyakit jantung menggunakan algoritma decision tree series C4.5 dengan RapidMiner. Jurnal Teknologi dan Sistem Informasi Bisnis, 5(2), 73–83. http://jurnal.unidha.ac.id/index.php/jteksis/article/view/775
Idri, A., Kadi, I., & Benjelloun, H. (2015). Heart disease diagnosis using C4.5 algorithms: A case study. In HEALTHINF-2015. SCITEPRESS. https://www.scitepress.org/papers/2015/52164/52164.pdf
Jannah, S. S. N., Riska, N. F., Alamsyah, M., & Indrayatna, F. (2023). Pengklasifikasian penyakit jantung dengan metode decision tree. Prosiding Nasional Statistika dan Analitika (NSA) – Universitas Padjadjaran. https://prosidingsnsa.statistics.unpad.ac.id/?journal=prosidingsnsa&op=view&page=article&path%5B%5D=348
Myint, K. L., & Htake Khaung Tin, H. (2021). Analyzing the comparison of C4.5, CART and C5.0 algorithms on heart disease dataset using decision tree method. In Proceedings of the 2nd International Conference on ICT for Digital, Smart, and Sustainable Development (ICIDSSD 2020). EAI. https://eudl.eu/pdf/10.4108/eai.27-2-2020.2303221
Nafi’ah, L., & Fatah, Z. (2024). Implementasi algoritma decision tree untuk pendeteksian penyakit jantung. Jurnal Sistem Informasi dan Informatika (JUSIFOR), 3(2), 160–165. https://ejournal.uniramalang.ac.id/index.php/jusifor/article/view/5729
Rodriguez, Z. M. P., & Nafea, M. (2024). Centralized and federated heart disease classification models using UCI dataset and their Shapley-value based interpretability. arXiv preprint. https://arxiv.org/abs/2408.06183
Santoso, M., Al-Akbar, B., Nurjaya, H., Ramadhan, S. A., Rizky, N. A., & Fadillah, A. (2023). Klasifikasi potensi penyakit jantung menggunakan algoritma C4.5. Jurnal INSAN, 3(2), 103–110. https://jurnal.bsi.ac.id/index.php/jinsan/article/view/3056/1484
Sepharni, A., Hendrawan, I. E., & Rozikin, C. (2023). Klasifikasi penyakit jantung dengan menggunakan algoritma C4.5. ResearchGate. https://www.researchgate.net/publication/367619484_Klasifikasi_Penyakit_Jantung_dengan_Menggunakan_Algoritma_C45
UCI Machine Learning Repository. (n.d.). Heart disease dataset. https://archive.ics.uci.edu/datasets/
Umbara, F. R., & Kasyidi, F. (2023). Klasifikasi risiko kematian pasien berdasarkan penyakit penyerta dan usia pasien menggunakan metode C4.5. Jurnal Informatika dan Rekayasa Elektronik, 6(1), 9–17. https://ejournal.stmiklombok.ac.id/index.php/jire/article/view/699
Wibowo, A. C., Lestari, S. A., & Nurchim, N. (2024). Analisis penggunaan machine learning dalam klasifikasi penentuan penyakit jantung. Simtek: Jurnal Sistem Informasi dan Teknik Komputer, 9(2), 97–101. https://doi.org/10.51876/simtek.v9i2.395
World Health Organization. (2021, June). Cardiovascular diseases (CVDs). https://www.who.int/news-room/fact-sheets/detail/cardiovascular-diseases-(cvds)
Zriqat, I. A., Altamimi, A. M., & Azzeh, M. (2017). A comparative study for predicting heart diseases using data mining classification methods. arXiv preprint. https://arxiv.org/abs/1704.02799