Perbandingan Metode Ensemble Learning pada Klasifikasi Penyakit Diabetes

Linggar Maretva Cendani; Adi Wibowo

doi:10.14710/jmasif.13.1.42912

DOI: https://doi.org/10.14710/jmasif.13.1.42912

Perbandingan Metode Ensemble Learning pada Klasifikasi Penyakit Diabetes

Linggar Maretva Cendani , Adi Wibowo

Departemen Informatika, Universitas Diponegoro, Jl. Prof. Sudarto, SH, Tembalang, Semarang, Indonesia 50275, Indonesia

Received: 26 Nov 2021; Revised: 6 May 2022; Accepted: 9 May 2022; Available online: 27 May 2022; Published: 27 May 2022.

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

BibTex Citation Data :

@article{JMASIF42912,
    author = {Linggar Maretva Cendani and Adi Wibowo},
    title = {Perbandingan Metode Ensemble Learning pada Klasifikasi Penyakit Diabetes},
    journal = {Jurnal Masyarakat Informatika},
  volume = {13},
    number = {1},
    year = {2022},
    keywords = {Bagging; Boosting; Diabetes; Ensemble Learning; Stacking},
    abstract = { Diabetes merupakan salah satu penyakit dalam dunia medis yang ditandai dengan kadar gula dalam darah yang tinggi pada penderitanya. Menurut data dari Organisasi Kesehatan Dunia (WHO), pada rentang tahun 1980 sampai 2014, terjadi peningkatan kasus penderita diabetes dari 108 juta menjadi 422 juta. Ensemble Learning yang merupakan salah satu metode dalam Machine Learning dapat digunakan untuk melakukan klasifikasi penyakit diabetes. Pada penelitian ini, dilakukan perbandingan 3 metode Ensemble Learning, yaitu Bagging, Boosting, dan Stacking pada 3 buah dataset. 3 dataset yang digunakan adalah Pima Indians Diabetes, Frankfurt Hospital Diabetes, dan Sylhet Hospital Diabetes. Dari hasil eksperimen ensemble learning yang dilakukan pada ketiga buah dataset, didapatkan bahwa metode Boosting dapat mengungguli metode Bagging dan Stacking. Pada dataset 1, didapatkan akurasi tertinggi sebesar 81.82 % dengan model Gradient Boosting, Extreme Gradient Boosting, dan Cat Boosting. Pada dataset 2, didapatkan akurasi tertinggi sebesar 99.25 % dengan menggunakan model Light Gradient Boosting. Sedangkan akurasi tertinggi pada dataset ketiga adalah 100% dengan menggunakan model Light Gradient Boosting dan Cat Boosting  Diabetes merupakan salah satu penyakit dalam dunia medis yang ditandai dengan kadar gula dalam darah yang tinggi pada penderitanya. Menurut data dari Organisasi Kesehatan Dunia (WHO), pada rentang tahun 1980 sampai 2014, terjadi peningkatan kasus penderita diabetes dari 108 juta menjadi 422 juta. Ensemble Learning yang merupakan salah satu metode dalam Machine Learning dapat digunakan untuk melakukan klasifikasi penyakit diabetes. Pada penelitian ini, dilakukan perbandingan 3 metode Ensemble Learning, yaitu Bagging, Boosting, dan Stacking pada 3 buah dataset. 3 dataset yang digunakan adalah Pima Indians Diabetes, Frankfurt Hospital Diabetes, dan Sylhet Hospital Diabetes. Dari hasil eksperimen ensemble learning yang dilakukan pada ketiga buah dataset, didapatkan bahwa metode Boosting dapat mengungguli metode Bagging dan Stacking. Pada dataset 1, didapatkan akurasi tertinggi sebesar 81.82 % dengan model Gradient Boosting, Extreme Gradient Boosting, dan Cat Boosting. Pada dataset 2, didapatkan akurasi tertinggi sebesar 99.25 % dengan menggunakan model Light Gradient Boosting. Sedangkan akurasi tertinggi pada dataset ketiga adalah 100% dengan menggunakan model Light Gradient Boosting dan Cat Boosting. },
   issn = {2777-0648},   pages = {33--44}  doi = {10.14710/jmasif.13.1.42912},
    url = {https://ejournal.undip.ac.id/index.php/jmasif/article/view/42912}
}

Citation Format:

Abstract

Diabetes merupakan salah satu penyakit dalam dunia medis yang ditandai dengan kadar gula dalam darah yang tinggi pada penderitanya. Menurut data dari Organisasi Kesehatan Dunia (WHO), pada rentang tahun 1980 sampai 2014, terjadi peningkatan kasus penderita diabetes dari 108 juta menjadi 422 juta. Ensemble Learning yang merupakan salah satu metode dalam Machine Learning dapat digunakan untuk melakukan klasifikasi penyakit diabetes. Pada penelitian ini, dilakukan perbandingan 3 metode Ensemble Learning, yaitu Bagging, Boosting, dan Stacking pada 3 buah dataset. 3 dataset yang digunakan adalah Pima Indians Diabetes, Frankfurt Hospital Diabetes, dan Sylhet Hospital Diabetes. Dari hasil eksperimen ensemble learning yang dilakukan pada ketiga buah dataset, didapatkan bahwa metode Boosting dapat mengungguli metode Bagging dan Stacking. Pada dataset 1, didapatkan akurasi tertinggi sebesar 81.82 % dengan model Gradient Boosting, Extreme Gradient Boosting, dan Cat Boosting. Pada dataset 2, didapatkan akurasi tertinggi sebesar 99.25 % dengan menggunakan model Light Gradient Boosting. Sedangkan akurasi tertinggi pada dataset ketiga adalah 100% dengan menggunakan model Light Gradient Boosting dan Cat BoostingDiabetes merupakan salah satu penyakit dalam dunia medis yang ditandai dengan kadar gula dalam darah yang tinggi pada penderitanya. Menurut data dari Organisasi Kesehatan Dunia (WHO), pada rentang tahun 1980 sampai 2014, terjadi peningkatan kasus penderita diabetes dari 108 juta menjadi 422 juta. Ensemble Learning yang merupakan salah satu metode dalam Machine Learning dapat digunakan untuk melakukan klasifikasi penyakit diabetes. Pada penelitian ini, dilakukan perbandingan 3 metode Ensemble Learning, yaitu Bagging, Boosting, dan Stacking pada 3 buah dataset. 3 dataset yang digunakan adalah Pima Indians Diabetes, Frankfurt Hospital Diabetes, dan Sylhet Hospital Diabetes. Dari hasil eksperimen ensemble learning yang dilakukan pada ketiga buah dataset, didapatkan bahwa metode Boosting dapat mengungguli metode Bagging dan Stacking. Pada dataset 1, didapatkan akurasi tertinggi sebesar 81.82 % dengan model Gradient Boosting, Extreme Gradient Boosting, dan Cat Boosting. Pada dataset 2, didapatkan akurasi tertinggi sebesar 99.25 % dengan menggunakan model Light Gradient Boosting. Sedangkan akurasi tertinggi pada dataset ketiga adalah 100% dengan menggunakan model Light Gradient Boosting dan Cat Boosting.

Fulltext View|Download Email colleagues

Keywords: Bagging; Boosting; Diabetes; Ensemble Learning; Stacking

Article Metrics:

Article Info

Section: Research Article

Language : ID

In Vol 13, No 1 (2022): May 2022

Most cited articles

KLASIFIKASI UCAPAN KATA DENGAN SUPPORT VECTOR MACHINE Studi Komparasi Ekstraksi Fitur pada Pengenalan Wajah Menggunakan Principal Component Analysis (PCA) dan Wavelet Daubechies Pengenalan Jenis Golongan Darah Menggunakan Jaringan Syaraf Tiruan Perceptron ANALISA PERFORMA METODE COSINE DAN JACARD PADA PENGUJIAN KESAMAAN DOKUMEN APLIKASI SISTEM INFORMASI GEOGRAFIS BERBASIS WEB PENYEBARAN DANA BANTUAN OPERASIONAL SEKOLAH More cited articles

Emerging Risk Factors Collaboration. (2010). Diabetes mellitus, fasting blood glucose concentration, and risk of vascular disease: a collaborative meta-analysis of 102 prospective studies. The Lancet, 375(9733), 2215-2222
World Health Organization. Diabetes. 2021. URL: https://www.who.int/en/news-room/fact-sheets/detail/diabetes , diakses tanggal 7 Juni 2021
S. J. Russell, P. Norvig, J. F. Canny, J. M. Malik, and D. D. Edwards, “Artificial Intelligence: A Modern Approach”, vol. 2. Prentice hall Englewood Cliffs, 1995
Smith, J. W., Everhart, J. E., Dickson, W. C., Knowler, W. C., Johannes, R. S., “Using the ADAP learning”
Bhoi, S. K. (2021). Prediction of Diabetes in Females of Pima Indian Heritage: A Complete Supervised Learning Approach. Turkish Journal of Computer and Mathematics Education (TURCOMAT), 12(10), 3074-3084
Agatsa, D. A., Rismala, R., & Wisesty, U. N. (2020). Klasifikasi Pasien Pengidap Diabetes Menggunakan Metode Support Vector Machine. eProceedings of Engineering, 7(1)
Sisodia, D., & Sisodia, D. S. (2018). Prediction of diabetes using classification algorithms. Procedia computer science, 132, 1578-1585
Savvas Karatsiolis, Christos N. Schizas, “Region based Support Vector Machine Algorithm for Medical Diagnosis on Pima Indian Diabetes DataSet”, 2012
Maulidina, F., Rustam, Z., Hartini, S., Wibowo, V. V. P., Wirasati, I., & Sadewo, W. (2021, March). Feature optimization using Backward Elimination and Support Vector Machines (SVM) algorithm for diabetes classification. In Journal of Physics: Conference Series (Vol. 1821, No. 1, p. 012006). IOP Publishing
Daanouni, O., Cherradi, B., & Tmiri, A. (2019, October). Predicting diabetes diseases using mixed data and supervised machine learning algorithms. In Proceedings of the 4th International Conference on Smart City Applications (pp. 1-6)
Nai-Arun, N., & Sittidech, P. (2014). Ensemble learning model for diabetes classification. In Advanced Materials Research (Vol. 931, pp. 1427-1431). Trans Tech Publications Ltd
Mung, P. S., & Phyu, S. (2020, February). Ensemble Learning Method for Enhancing Healthcare Classification. Proceedings of the 10th International Workshop on Computer Science and Engineering (WCSE 2020)
UCI Machine Learning. Pima Indians Diabetes Database. 2016. URL: https://www.kaggle.com/uciml/pima-indians-diabetes-database , diakses tanggal 7 Juni 2021
John. diabetes. 2017. URL: https://www.kaggle.com/johndasilva/diabetes , diakses tanggal 7 Juni 2021
Ishan Dutta. Early Stage Diabetes Risk Prediction Dataset. 2020. URL: https://www.kaggle.com/ishandutta/early-stage-diabetes-risk-prediction-dataset , diakses tanggal 7 Juni 2021

Last update:

Sentiment Analysis of the Indonesia Presidential Election 2024 with Ensemble Learning for Reducing Disinformation on Social Media
Jihan Nabilah Hakim, Yuliant Sibaroni, Sri Suryani Prasetiyowati. 2023 11th International Conference on Information and Communication Technology (ICoICT), 2023. doi: 10.1109/ICoICT58202.2023.10262584

Last update: 2026-08-02 01:03:25

No citation recorded.

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

The authors who submit the manuscript must understand that the article's copyright belongs to the author(s) if accepted for publication. However, the author(s) grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution-ShareAlike 4.0 International License. Authors should also understand that their article (and any additional files, including data sets, and analysis/computation data) will become publicly available once published under that license. By submitting the manuscript to Jmasif, the author(s) agree with this policy. No special document approval is required.

The author(s) guarantee that:

their article is original, written by the mentioned author(s),
has never been published before,
does not contain statements that violate the law, and
does not violate the rights of others, is subject to copyright held exclusively by the author(s), is free from the rights of third parties, and the necessary written permission to quote from other sources has been obtained by the author(s).

The author(s) retain all rights to the published work, such as (but not limited to) the following rights:

Copyright and other proprietary rights related to the article, such as patents,
The right to use the substance of the article in its own future works, including lectures and books,
The right to reproduce the article for its own purposes,
The right to archive all versions of the article in any repository, and
The right to enter into separate additional contractual arrangements for the non-exclusive distribution of published versions of the article (for example, posting them to institutional repositories or publishing them in a book), acknowledging its initial publication in this journal (Jurnal Masyarakat Informatika).

Suppose the article was prepared jointly by more than one author. Each author submitting the manuscript warrants that all co-authors have given their permission to agree to copyright and license notices (agreements) on their behalf and notify co-authors of the terms of this policy. Jmasif will not be held responsible for anything arising because of the writer's internal dispute. Jmasif will only communicate with correspondence authors.

Authors should also understand that their articles (and any additional files, including data sets and analysis/computation data) will become publicly available once published. The license of published articles (and additional data) will be governed by a Creative Commons Attribution-ShareAlike 4.0 International License. Jmasif allows users to copy, distribute, display and perform work under license. Users need to attribute the author(s) and Jmasif to distribute works in journals and other publication media. Unless otherwise stated, the author(s) is a public entity as soon as the article is published.