skip to main content

Perbandingan Metode Ensemble Learning pada Klasifikasi Penyakit Diabetes

Departemen Informatika, Universitas Diponegoro, Jl. Prof. Sudarto, SH, Tembalang, Semarang, Indonesia 50275, Indonesia

Received: 26 Nov 2021; Revised: 6 May 2022; Accepted: 9 May 2022; Available online: 27 May 2022; Published: 27 May 2022.
Editor(s): Prajanto Adi
Open Access Copyright (c) 2022 JURNAL MASYARAKAT INFORMATIKA
Creative Commons License This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Citation Format:
Abstract
Diabetes merupakan salah satu penyakit dalam dunia medis yang ditandai dengan kadar gula dalam darah yang tinggi pada penderitanya. Menurut data dari Organisasi Kesehatan Dunia (WHO), pada rentang tahun 1980 sampai 2014, terjadi peningkatan kasus penderita diabetes dari 108 juta menjadi 422 juta. Ensemble Learning yang merupakan salah satu metode dalam Machine Learning dapat digunakan untuk melakukan klasifikasi penyakit diabetes. Pada penelitian ini, dilakukan perbandingan 3 metode Ensemble Learning, yaitu Bagging, Boosting, dan Stacking pada 3 buah dataset. 3 dataset yang digunakan adalah Pima Indians Diabetes, Frankfurt Hospital Diabetes, dan Sylhet Hospital Diabetes. Dari hasil eksperimen ensemble learning yang dilakukan pada ketiga buah dataset, didapatkan bahwa metode Boosting dapat mengungguli metode Bagging dan Stacking. Pada dataset 1, didapatkan akurasi tertinggi sebesar 81.82 % dengan model Gradient Boosting, Extreme Gradient Boosting, dan Cat Boosting. Pada dataset 2, didapatkan akurasi tertinggi sebesar 99.25 % dengan menggunakan model Light Gradient Boosting. Sedangkan akurasi tertinggi pada dataset ketiga adalah 100% dengan menggunakan model Light Gradient Boosting dan Cat BoostingDiabetes merupakan salah satu penyakit dalam dunia medis yang ditandai dengan kadar gula dalam darah yang tinggi pada penderitanya. Menurut data dari Organisasi Kesehatan Dunia (WHO), pada rentang tahun 1980 sampai 2014, terjadi peningkatan kasus penderita diabetes dari 108 juta menjadi 422 juta. Ensemble Learning yang merupakan salah satu metode dalam Machine Learning dapat digunakan untuk melakukan klasifikasi penyakit diabetes. Pada penelitian ini, dilakukan perbandingan 3 metode Ensemble Learning, yaitu Bagging, Boosting, dan Stacking pada 3 buah dataset. 3 dataset yang digunakan adalah Pima Indians Diabetes, Frankfurt Hospital Diabetes, dan Sylhet Hospital Diabetes. Dari hasil eksperimen ensemble learning yang dilakukan pada ketiga buah dataset, didapatkan bahwa metode Boosting dapat mengungguli metode Bagging dan Stacking. Pada dataset 1, didapatkan akurasi tertinggi sebesar 81.82 % dengan model Gradient Boosting, Extreme Gradient Boosting, dan Cat Boosting. Pada dataset 2, didapatkan akurasi tertinggi sebesar 99.25 % dengan menggunakan model Light Gradient Boosting. Sedangkan akurasi tertinggi pada dataset ketiga adalah 100% dengan menggunakan model Light Gradient Boosting dan Cat Boosting.
Fulltext View|Download
Keywords: Bagging; Boosting; Diabetes; Ensemble Learning; Stacking

Article Metrics:

  1. Emerging Risk Factors Collaboration. (2010). Diabetes mellitus, fasting blood glucose concentration, and risk of vascular disease: a collaborative meta-analysis of 102 prospective studies. The Lancet, 375(9733), 2215-2222
  2. World Health Organization. Diabetes. 2021. URL: https://www.who.int/en/news-room/fact-sheets/detail/diabetes , diakses tanggal 7 Juni 2021
  3. S. J. Russell, P. Norvig, J. F. Canny, J. M. Malik, and D. D. Edwards, “Artificial Intelligence: A Modern Approach”, vol. 2. Prentice hall Englewood Cliffs, 1995
  4. Smith, J. W., Everhart, J. E., Dickson, W. C., Knowler, W. C., Johannes, R. S., “Using the ADAP learning”
  5. Bhoi, S. K. (2021). Prediction of Diabetes in Females of Pima Indian Heritage: A Complete Supervised Learning Approach. Turkish Journal of Computer and Mathematics Education (TURCOMAT), 12(10), 3074-3084
  6. Agatsa, D. A., Rismala, R., & Wisesty, U. N. (2020). Klasifikasi Pasien Pengidap Diabetes Menggunakan Metode Support Vector Machine. eProceedings of Engineering, 7(1)
  7. Sisodia, D., & Sisodia, D. S. (2018). Prediction of diabetes using classification algorithms. Procedia computer science, 132, 1578-1585
  8. Savvas Karatsiolis, Christos N. Schizas, “Region based Support Vector Machine Algorithm for Medical Diagnosis on Pima Indian Diabetes DataSet”, 2012
  9. Maulidina, F., Rustam, Z., Hartini, S., Wibowo, V. V. P., Wirasati, I., & Sadewo, W. (2021, March). Feature optimization using Backward Elimination and Support Vector Machines (SVM) algorithm for diabetes classification. In Journal of Physics: Conference Series (Vol. 1821, No. 1, p. 012006). IOP Publishing
  10. Daanouni, O., Cherradi, B., & Tmiri, A. (2019, October). Predicting diabetes diseases using mixed data and supervised machine learning algorithms. In Proceedings of the 4th International Conference on Smart City Applications (pp. 1-6)
  11. Nai-Arun, N., & Sittidech, P. (2014). Ensemble learning model for diabetes classification. In Advanced Materials Research (Vol. 931, pp. 1427-1431). Trans Tech Publications Ltd
  12. Mung, P. S., & Phyu, S. (2020, February). Ensemble Learning Method for Enhancing Healthcare Classification. Proceedings of the 10th International Workshop on Computer Science and Engineering (WCSE 2020)
  13. UCI Machine Learning. Pima Indians Diabetes Database. 2016. URL: https://www.kaggle.com/uciml/pima-indians-diabetes-database , diakses tanggal 7 Juni 2021
  14. John. diabetes. 2017. URL: https://www.kaggle.com/johndasilva/diabetes , diakses tanggal 7 Juni 2021
  15. Ishan Dutta. Early Stage Diabetes Risk Prediction Dataset. 2020. URL: https://www.kaggle.com/ishandutta/early-stage-diabetes-risk-prediction-dataset , diakses tanggal 7 Juni 2021

Last update:

  1. Sentiment Analysis of the Indonesia Presidential Election 2024 with Ensemble Learning for Reducing Disinformation on Social Media

    Jihan Nabilah Hakim, Yuliant Sibaroni, Sri Suryani Prasetiyowati. 2023 11th International Conference on Information and Communication Technology (ICoICT), 2023. doi: 10.1109/ICoICT58202.2023.10262584

Last update: 2024-12-27 10:47:23

No citation recorded.