Optimalisasi Prediksi Kasus Demam Berdarah Dengue (DBD) Menggunakan Regresi Logistik Biner dengan Pendekatan SMOTE dan Tuning Hyperparameter

  • Rosa Ratri Kusuma Hariningsih Sekolah Tinggi Ilmu Komputer Yos Sudarso Purwokerto
  • Diwahana Mutiara Candrasari STIKOM Yos Sudarso
  • Endang Setyawati STIKOM Yos Sudarso

Abstract

Demam Berdarah Dengue (DBD) merupakan penyakit endemis yang masih menjadi tantangan kesehatan masyarakat di Indonesia. Deteksi dini terhadap potensi munculnya kasus DBD sangat krusial untuk penanggulangan yang cepat dan tepat. Penelitian ini bertujuan untuk mengembangkan model prediksi kasus DBD menggunakan Regresi Logistik Biner dengan penanganan data tidak seimbang melalui teknik Synthetic Minority Over-sampling Technique (SMOTE) dan optimasi model menggunakan hyperparameter tuning. Dataset yang digunakan mencakup data cuaca dan kasus DBD di wilayah Purwokerto tahun 2022–2024. Hasil penelitian menunjukkan bahwa setelah dilakukan penyeimbangan data dan tuning parameter, model mampu mencapai akurasi validasi silang sebesar 84,12%, meskipun akurasi pada data uji menurun menjadi 64%. Meskipun demikian, pendekatan ini menunjukkan potensi dalam pemodelan prediktif kasus DBD yang lebih akurat dan inklusif

References

Badan Pusat Statistik Kabupaten Banyumas. (2023). Kabupaten Banyumas dalam angka 2023. BPS Kabupaten Banyumas. https://banyumaskab.bps.go.id/publication
Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32. https://doi.org/10.1023/A:1010933404324
Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research, 16, 321–357. https://doi.org/10.1613/jair.953
Hosmer, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied logistic regression (3rd ed.). Wiley.
Kementerian Kesehatan Republik Indonesia. (2022). Profil kesehatan Indonesia tahun 2021. Pusat Data dan Informasi Kesehatan, Kemenkes RI. https://pusdatin.kemkes.go.id/resources/download/pusdatin/profil-kesehatan-indonesia/Profil-Kesehatan-Indonesia-2021.pdf
Kuhn, M., & Johnson, K. (2013). Applied predictive modeling. Springer. https://doi.org/10.1007/978-1-4614-6849-3
He, H., & Garcia, E. A. (2009). Learning from imbalanced data. IEEE Transactions on Knowledge and Data Engineering, 21(9), 1263–1284. https://doi.org/10.1109/TKDE.2008.239
Bergstra, J., & Bengio, Y. (2012). Random search for hyper-parameter optimization. Journal of Machine Learning Research, 13, 281–305. http://jmlr.org/papers/v13/bergstra12a.html
Zhang, C., & Ma, Y. (2012). Ensemble machine learning: Methods and applications. Springer. https://doi.org/10.1007/978-1-4419-9326-7
Barros, R. C., Basgalupp, M. P., de Carvalho, A. C. P. L. F., & Freitas, A. A. (2014). A survey of evolutionary algorithms for decision-tree induction. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 44(3), 445–463. https://doi.org/10.1109/TSMC.2013.226
Fernández, A., García, S., Galar, M., Prati, R. C., Krawczyk, B., & Herrera, F. (2018). Learning from imbalanced data sets. Springer. https://doi.org/10.1007/978-3-319-98074-4
Batista, G. E. A. P. A., Prati, R. C., & Monard, M. C. (2004). A study of the behavior of several methods for balancing machine learning training data. ACM SIGKDD Explorations Newsletter, 6(1), 20–29. https://doi.org/10.1145/1007730.1007735
López, V., Fernández, A., García, S., Palade, V., & Herrera, F. (2013). An insight into classification with imbalanced data: Empirical results and current trends on using data intrinsic characteristics. Information Sciences, 250, 113–141. https://doi.org/10.1016/j.ins.2013.07.007
Dietterich, T. G. (2000). Ensemble methods in machine learning. In J. Kittler & F. Roli (Eds.), Multiple classifier systems (pp. 1–15). Springer. https://doi.org/10.1007/3-540-45014-9_1
Chicco, D., & Jurman, G. (2020). The advantages of the Matthews correlation coefficient (MCC) over F1 score and accuracy in binary classification evaluation. BMC Genomics, 21(1), 6. https://doi.org/10.1186/s12864-019-6413-7
Published
2025-06-28
How to Cite
KUSUMA HARININGSIH, Rosa Ratri; CANDRASARI, Diwahana Mutiara; SETYAWATI, Endang. Optimalisasi Prediksi Kasus Demam Berdarah Dengue (DBD) Menggunakan Regresi Logistik Biner dengan Pendekatan SMOTE dan Tuning Hyperparameter. Joined Journal (Journal of Informatics Education), [S.l.], v. 8, n. 1, p. 79-88, june 2025. ISSN 2620-8415. Available at: <https://www.e-journal.ivet.ac.id/index.php/jiptika/article/view/3863>. Date accessed: 05 july 2025. doi: https://doi.org/10.31331/joined.v8i1.3863.

Most read articles by the same author(s)

Obs.: This plugin requires at least one statistics/report plugin to be enabled. If your statistics plugins provide more than one metric then please also select a main metric on the admin's site settings page and/or on the journal manager's settings pages.