Evaluasi Kinerja Algoritma Ensemble Learning Pada Klasifikasi Penyakit Diabetes Berbasis Boosting Method
DOI:
https://doi.org/10.48144/suryainformatika.v16i1.2424Keywords:
Diabetes Classification, Ensemble Learning, Gradient Boosting, XGBoost, CatBoostAbstract
Penyakit diabetes merupakan salah satu penyakit kronis yang memerlukan deteksi dini untuk mencegah komplikasi lebih lanjut. Dalam era data mining, penerapan algoritma machine learning khususnya metode ensemble learning berbasis boosting menjadi salah satu pendekatan yang efektif untuk klasifikasi penyakit. Penelitian ini bertujuan untuk mengevaluasi kinerja beberapa algoritma boosting, yaitu Gradient Boosting, Extreme Gradient Boosting (XGBoost), dan CatBoost dalam mengklasifikasikan penyakit diabetes. Dataset yang digunakan terdiri dari 19.230 data dengan dua kelas, yaitu non-diabetes dan diabetes. Evaluasi model dilakukan menggunakan metrik precision, recall, f1-score, dan accuracy. Hasil penelitian menunjukkan bahwa ketiga algoritma memiliki performa yang sangat baik dengan tingkat akurasi sebesar 97%. Gradient Boosting menghasilkan precision sebesar 0,99 dan recall sebesar 0,69 pada kelas diabetes dengan f1-score sebesar 0,81. XGBoost menunjukkan precision sebesar 0,97, recall 0,69, dan f1-score 0,81. Sementara itu, CatBoost menghasilkan precision sebesar 0,98, recall 0,69, dan f1-score 0,81 pada kelas diabetes. Secara keseluruhan, ketiga metode menunjukkan kinerja yang sebanding, dengan keunggulan kecil pada Gradient Boosting dalam hal precision. Namun demikian, nilai recall yang relatif rendah pada kelas diabetes menunjukkan bahwa masih terdapat tantangan dalam mendeteksi seluruh kasus positif. Oleh karena itu, diperlukan pengembangan lebih lanjut untuk meningkatkan sensitivitas model dalam klasifikasi penyakit diabetes
References
I. Murdani et al., “STRATEGI PENCEGAHAN DIABETES MELITUS MELALUI EDUKASI DAN PARTISIPASI MASYARAKAT DI GAMPONG BLANG DALAM, KABUPATEN ACEH BARAT,” J. Pengabdi. Kpd. Masy. Bid. Kesehat., vol. 7, no. 2, pp. 96–102, 2025.
E. Erdaliza, M. Mitra, N. Rany, Y. Harnani, and A. Rienarti Abidin, “Faktor risiko yang berhubungan dengan komplikasi Diabetes Mellitus Tipe 2,” J. Kesehat. komunitas (Journal community Heal., vol. 10, no. 3, pp. 534–545, Dec. 2024, doi: 10.25311/keskom.Vol10.Iss3.2039.
K. Tampubolon, H. Saragih, B. Reza, K. Epicentrum, and A. Asosiasi, “Implementasi Data Mining Algoritma Apriori pada sistem persediaan alat-alat kesehatan,” Maj. Ilm. Inf. dan Teknol. Ilm., vol. 1, no. 1, pp. 93–106, 2013.
A. Astofa, P. Rosyani, R. Rahmawati, and S. Apandi, “Evaluasi Komparatif Algoritma Machine Learning untuk Prediksi Dini Diabetes,” Bull. Comput. Sci. Res., vol. 6, no. 1 SE-, pp. 558–565, Dec. 2025, doi: 10.47065/bulletincsr.v6i1.859.
K. Syaban and Mardiawati, “Evaluasi Model Ensemble Learning pada Identifikasi Faktor Risiko Diabetes Mellitus,” J. Teknol. dan Inf., vol. 15, no. 2, pp. 121–130, Sep. 2025, doi: 10.34010/jati.v15i2.16238.
Y. A. Mustofa and I. S. K. Idris, “Ensemble Approach to Sentiment Analysis of Google Play Store App Reviews,” Jambura J. Electr. Electron. Eng., vol. 6, no. 2, pp. 181–188, Jul. 2024, doi: 10.37905/jjeee.v6i2.25184.
H. Al Aziz and H. A. Santoso, “Model Prediksi Stunting Anak di Indonesia Menggunakan Extreme Gradient Boosting,” J. Algoritm., vol. 22, no. 1 SE-Artikel, pp. 1072–1085, Jul. 2025, doi: 10.33364/algoritma/v.22-1.2289.
A. S. Alfath, A. K. Wardhana, and R. Rumini, “Hypertension Risk Prediction Using Stacking Ensemble of CatBoost, XGBoost, and LightGBM: A Machine Learning Approach,” J. Appl. Informatics Comput., vol. 9, no. 6, pp. 3146–3156, Dec. 2025, doi: 10.30871/jaic.v9i6.10370.
M. R. Muhaimin, D. M. Karina, and A. B. Krisna, “Prediksi Kualitas Udara Malang Menggunakan Metode Gradient Boosting Regression,” Digit. Transform. Technol., vol. 4, no. 2, pp. 937–942, Dec. 2024, doi: 10.47709/digitech.v4i2.5046.
D. A. Murtiningsih, B. W. Sari, and I. N. Fajri, “Comparison of Light Gradient Boosting Machine, eXtreme Gradient Boosting, and CatBoost with Balancing and Hyperparameter Tuning for Hypertension Risk Prediction on Clinical Dataset,” J. Appl. Informatics Comput., vol. 9, no. 5, pp. 2753–2763, Oct. 2025, doi: 10.30871/jaic.v9i5.10400.
A. Mukhid, Metodologi penelitian pendekatan kuantitatif. Jakad Media Publishing, 2021.
M. I. Syahroni, “Prosedur penelitian kuantitatif,” EJurnal Al Musthafa, vol. 2, no. 3, pp. 43–56, 2022.
N. Yunitri et al., “METODE PENELITIAN EKSPERIMENTAL,” J. Kesehat., vol. 11, no. 2 SE-Original article, pp. 67–79, Jan. 2024, doi: 10.35913/jk.v11i2.453.
K. Rozikin, Sistem Basis Data, vol. 9, no. 1 SE-Judul Buku. Penerbit Yayasan Prima Agus Teknik, 2023. [Online]. Available: https://penerbit.stekom.ac.id/index.php/yayasanpat/article/view/412
W. Warsito, A. L. Pratama, and E. Rilvani, “PENERAPAN METODOLOGI EKSPLORASI DATASET DALAM EVALUASI KECENDERUNGAN PELAJAR PADA BIDANG SAINS MELALUI PENDEKATAN K-MEANS CLUSTERING DI SMA NEGERI 89 JAKARTA,” Kohesi J. Sains dan Teknol., vol. 10, no. 1 SE-Articles, pp. 121–130, doi: 10.2238/q4trs324.
J. J. Hidayat and S. Hasanudin, “Prediksi Volatilitas IHSG Dengan Hybrid Model GARCH–Random Forest Berbasis Machine Learning,” J. Manaj. Inform. Teknol., vol. 6, no. 1 SE-Articles, pp. 130–140, 2026, doi: 10.51903/mifortekh.v6i1.1134.
J. J. Hidayat, C. Setyowati, M. D. I. Amin, K. Bimasakti, and A. P. Werdana, “Deep Learning-based Sentiment Analysis of Public Comments on Military Education Using RoBERTa Algorithm and Rule-Based Hybird Parameters,” J. Media Comput. Sci., vol. 4, no. 2 SE-Articles, Jul. 2025, doi: 10.37676/jmcs.v4i2.8769.
J. J. Hidayat et al., “Prediksi Diabetes Menggunakan Deep Neural Network dengan Penyesuaian Hiperparameter Berbasis Bayesian Optimization,” J. Pract. Comput. Sci., vol. 5, no. 2, pp. 130–143, Jan. 2026, doi: 10.37366/jpcs.v5i2.6419.
M. D. I. Amin, J. J. Hidayat, C. Setyowati, E. K. Fitri, A. N. Anggraini, and A. P. Werdana, “Implementasi Model LSTM Untuk Peramalan Curah Hujan Di Bekasi Dengan Pemanfaatan Data Cuaca BMKG,” J. Teknol. Inf. Digit., vol. 1, no. 2, pp. 90–99, [Online]. Available: https://jurnal.ipdig.id/index.php/jtid/article/view/200
M. A. Rahman Wahid, A. Nugroho, and A. Halim Anshor, “Prediksi Penyakit Kanker Paru-Paru Dengan Algoritma Regresi Linier,” Bull. Inf. Technol., vol. 4, no. 1, pp. 63–74, Mar. 2023, doi: 10.47065/bit.v4i1.501.
A. H. Anshor and A. T. Zy, “Implementasi Metode Decision Tree pada Sistem Prediksi Status Kualitas Produk Minuman A,” J. Ilm. Inform. Glob., vol. 15, no. 1, pp. 17–22, Apr. 2024, doi: 10.36982/jiig.v15i1.3778.
A. Z. Kamalia, Choiriyatun Nisa Latansa, and Zaenur Rozikin, “Klasifikasi Kondisi Pasar Harga Emas ANTAM Indonesia Menggunakan Algoritma Decision Tree,” J. Komput. Teknol. Inf. Sist. Inf., vol. 4, no. 3, pp. 2087–2098, Jan. 2026, doi: 10.62712/juktisi.v4i3.800.
Hans Santoso, Sabrina Phalosa Phai, Sarah Barbara, and Maryanto, “PERBANDINGAN ALGORITMA BOOSTING UNTUK KLASIFIKASI LINGKUNGAN TEKTONIK GEOKIMIA VULKANIK,” J. Ilmu Komput. dan Sist. Inf., vol. 14, no. 1 SE-Articles, Jan. 2026, doi: 10.24912/vqd3yd53.
Leriansyah Putra Nasyuli, Imran Lubis, and Andi Marwan Elhanafi, “Penerapan Model Machine Learning Algoritma Gradient Boosting dan Linear Regression Melakukan Prediksi Harga Kendaraan Bekas,” J. Ilmu Komput. dan Sist. Inf., vol. 2, no. 2, pp. 299–310, May 2023, doi: 10.70340/jirsi.v2i2.56.
R. G. Gunawan, Erik Suanda Handika, and Edi Ismanto, “Pendekatan Machine Learning Dengan Menggunakan Algoritma Xgboost (Extreme Gradient Boosting) Untuk Peningkatan Kinerja Klasifikasi Serangan Syn,” J. CoSciTech (Computer Sci. Inf. Technol., vol. 3, no. 3, pp. 453–463, Dec. 2022, doi: 10.37859/coscitech.v3i3.4356.
I Gusti Ayu Riyani Astarani and I Gede Surya Rahayuda, “Analisis Perbandingan XGBoost dan LightGBM dalam Prediksi Penjualan Ritel Walmart Store Sales,” J. Nas. Teknol. Inf. dan Apl. , vol. 3, no. 4 SE-Articles, pp. 717–728, doi: 10.24843/JNATIA.2025.v03.i04.p01.
A. Sah, C. Niesa, R. R. Jafar, and M. Muharrom, “Analisis Model Prediksi Penyakit Jantung Menggunakan Adaptive Boosting, Gradient Boosting, dan Extreme Gradient Boosting,” J. Ilm. Fifo, vol. 17, no. 1, pp. 46–56, 2025.
P. L. Arifa, K. Sadik, A. M. Soleh, and C. Suhaeni, “OPTIMASI XGBOOST DALAM PREDIKSI KECEPATAN KENDARAAN SECARA REAL-TIME : PERBANDINGAN METODE TUNING HYPERPARAMETER,” J. Gaussian; Vol 15, No 1 J. GaussianDO - 10.14710/j.gauss.15.1.01-11 , Jan. 2026, [Online]. Available: https://ejournal3.undip.ac.id/index.php/gaussian/article/view/52003
D. Triyana, M. Muharrom Al Haromainy, and H. Maulana, “IMPLEMENTASI METODE ENSEMBLE MAJORITY VOTE PADA ALGORITMA NAIVE BAYES DAN RANDOM FOREST UNTUK ANALISIS SENTIMEN TWITTER HARGA TIKET PESAWAT DOMESTIK,” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 4, pp. 7885–7894, Aug. 2024, doi: 10.36040/jati.v8i4.10475.
M. Gopinda, “Studi Perbandingan Algoritma Machine Learning Untuk Prediksi Penjualan Retail,” J. Ilmu Komput. dan Teknol. Inf., vol. 1, no. 1, pp. 22–28, 2026.
A. Febriansyah Istianto, A. Id Hadiana, and F. Rakhmat Umbara, “PREDIKSI CURAH HUJAN MENGGUNAKAN METODE CATEGORICAL BOOSTING (CATBOOST),” JATI (Jurnal Mhs. Tek. Inform., vol. 7, no. 4, pp. 2930–2937, Jan. 2024, doi: 10.36040/jati.v7i4.7304.
O. Pahlevi, D. A. N. Wulandari, L. K. Rahayu, H. Leidiyana, and Y. Handrianto, “Model Klasifikasi Risiko Stunting Pada Balita Menggunakan Algoritma CatBoost Classifier,” Bull. Comput. Sci. Res., vol. 4, no. 6, pp. 414–421, Oct. 2024, doi: 10.47065/bulletincsr.v4i6.373.
A. Nugroho, Wiyanto, and D. Maulana, “COMPARATIVE ANALYSIS OF CLASSIFICATION ALGORITHMS IN HANDLING IMBALANCED DATA WITH SMOTE OVERSAMPLING APPROACH,” JITK (Jurnal Ilmu Pengetah. dan Teknol. Komputer), vol. 11, no. 2, pp. 487–495, Nov. 2025, doi: 10.33480/jitk.v11i2.6956.
A. Nugroho, M. Danny, and I. Nawangsih, “Ensemble Learning for Robust Anomaly Detection in Banking Fraud,” in 2025 8th International Seminar on Research of Information Technology and Intelligent Systems (ISRITI), IEEE, Dec. 2025, pp. 649–654. doi: 10.1109/ISRITI68345.2025.11393116.
J. J. Hidayat, C. Setyowati, and A. P. Werdana, “Perancangan Sistem Prediksi Penyakit pada Tanaman Padi Berbasis Image Processing Menggunakan Algoritma VGG-16 Transfer Learning dan K-Means Segmentation,” J. Pract. Comput. Sci., vol. 5, no. 1, pp. 1–15, May 2025, doi: 10.37366/jpcs.v5i1.5759.
J. J. Hidayat, C. Setyowati, and A. P. Werdana, “Sentiment Analysis of Instagram User Comments related to the Inauguration of Mr. Prabowo Subianto as President of the Republic of Indonesia Using Natural Language Processing,” Int. J. Data Sci., vol. 6, no. 2, pp. 94–102, Dec. 2025, doi: 10.18517/ijods.6.2.94-102.2025.
R. N. Gurning, A. A. Sulaeman, and D. Afandi, “Breast Cancer Classification Using Naïve Bayes and Random Forest Algorithms,” J. Comput. Networks, Archit. High Perform. Comput., vol. 7, no. 3, pp. 920–933, Aug. 2025, doi: 10.47709/cnahpc.v7i3.6609.
N. Surojudin, S. Butsianto, and A. Firmansyah, “Perbandingan Kinerja Naïve Bayes dengan dan Tanpa SMOTE untuk Klasifikasi Gangguan Kecemasan Mahasiswa pada Data Tidak Seimbang,” Bull. Comput. Sci. Res., vol. 6, no. 2 SE-, pp. 804–812, Feb. 2026, doi: 10.47065/bulletincsr.v6i2.1021.
F. Reynaldi Valerian, M. Syarief, and D. Abdul Fatah, “KLASIFIKASI TINGKAT OBESITAS MENGGUNAKAN METODE GBM DAN CONFUSION MATRIX,” JATI (Jurnal Mhs. Tek. Inform., vol. 9, no. 2, pp. 2242–2249, Mar. 2025, doi: 10.36040/jati.v9i2.13062.
J. J. Hidayat, M. D. I. Amin, E. K. Fitri, A. N. Anggraini, A. P. Werdana, and C. Setyowati, “Implementasi Model EfficientNetB0 Pada Pembuatan Aplikasi Desktop Untuk Identifikasi Hama Tanaman Sawi Berbasis Deep Learning,” J. Teknol. Inf. Digit., vol. 1, no. 2, pp. 82–89, [Online]. Available: https://jurnal.ipdig.id/index.php/jtid/article/view/195




