PERBANDINGAN ALGORITMA RANDOM FOREST DAN XGBOOST UNTUK KLASIFIKASI PENYAKIT PARU-PARU BERDASARKAN DATA DEMOGRAFI PASIEN
DOI:
https://doi.org/10.36050/betrik.v15i02%20AGUSTUS.292Keywords:
Klasifikasi, Penyakit Paru-Paru, Random Forest, XGBoostAbstract
Dalam penelitian ini, algoritma Random Forest dan XGBoost dibandingkan dalam klasifikasi penyakit paru-paru menggunakan data demografi pasien. Dataset yang digunakan terdiri dari 30.000 data pasien dengan 9 atribut dan 1 label yang diambil dari Kaggle. Tahapan penelitian termasuk pengumpulan data, Preprocessing, pembagian data, dan klasifikasi data menggunakan kedua algoritma. Hasil menunjukkan bahwa algoritma XGBoost memiliki akurasi 94% dan AUC 0.98, sedangkan algoritma Random Forest memiliki akurasi 91% dan AUC 0.97. Meskipun Random Forest lebih cepat dan lebih mudah diinterpretasikan, XGBoost bekerja lebih baik dengan data yang kompleks dengan hasil yang lebih konsisten. Melalui penggunaan teknik regularisasi dan penanganan outliers yang lebih baik, XGBoost juga dapat mengatasi masalah overfitting dengan lebih baik. Studi ini memberikan panduan untuk peneliti dan praktisi dalam memilih algoritma terbaik untuk tugas klasifikasi medis, terutama yang berkaitan dengan penyakit paru-paru.
References
M. Y. Haffandi, E. Haerani, F. Syafria, and L. Oktavia, “Klasifikasi Penyakit Paru-Paru Dengan Menggunakan Metode Naïve Bayes Classifier,” J. Tek. Inf. dan Komput., vol. 5, no. 2, p. 176, 2022, doi: 10.37600/tekinkom.v5i2.649.
A. S. Pratama, S. Safrizal, and J. Iriani, “Sistem Pakar Mendiagnosa Penyakit Gangguan Pernafasan Oleh Asap Rokok Menggunakan Metode Dempster Shafer,” It (Informatic Tech. J., vol. 9, no. 1, p. 79, 2021, doi: 10.22303/it.9.1.2021.79-88.
E. W. Tipa, P. A. Kawatu, and A. F. C. Kalesaran, “Hubungan Kebiasaan Merokok Dengan Kapasitas Vital Paru Pada Penambang Emas Di Desa Tatelu Kabupaten Minahasa Uatara,” J. KESMAS, vol. 10, no. 3, pp. 140–146, 2021.
RSUD, “Bangsal Kemuning (Penyakit Paru),” RSUD, 2024. https://rsud.banjarkota.go.id/rawat-inap/bangsal-kemuning/
N. Ratama, “Analisa Dan Perbandingan Sistem Aplikasi Diagnosa Penyakit Asma Dengan Algoritma Certainty Factor Dan Algoritma Decision Tree Berbasis Android,” J. Inform. J. Pengemb. IT, vol. 3, no. 2, pp. 177–183, 2018, doi: 10.30591/jpit.v3i2.848.
M. S. C Imiliati, NB Nugroho, “Bronchitis Pada Anak Menggunakan Metode Certainty Factor Dan Teorema Bayes Di Upt .,” J. Cyber Tech, 2021.
Yellia Mangan, Solusi Sehat Mencegah & Mengatasi Kanker. AgroMedia, 2009.
G. A. Sandag, “Prediksi Rating Aplikasi App Store Menggunakan Algoritma Random Forest,” CogITo Smart J., vol. 6, no. 2, pp. 167–178, 2020, doi: 10.31154/cogito.v6i2.270.167-178.
J. H. Friedman, “Greedy function approximation: A gradient boosting machine,” Ann. Stat., vol. 29, no. 5, pp. 1189–1232, 2001, doi: 10.1214/aos/1013203451.
Z. Salam Patrous, “Evaluating XGBoost for User Classification by using Behavioral Features Extracted from Smartphone Sensors,” p. 67, 2018, [Online]. Available: https://www.diva-portal.org/smash/record.jsf?pid=diva2%3A1240595&dswid=-6444
F. Solikhah, M. Febianah, A. L. Kamil, W. A. Arifin, and Shelly Janu Setyaning Tyas, “Analisis Perbandingan Algoritma Naive Bayes Dan C.45 Dalam Klasifikasi Data Mining Untuk Memprediksi Kelulusan,” Tematik, vol. 8, no. 1, pp. 96–103, 2021, doi: 10.38204/tematik.v8i1.576.
Dimsyiar M Al Hafiz, Khoirul Amaly, Javen Jonathan, M Teranggono Rachmatullah, and Rosidi, “Sistem Prediksi Penyakit Jantung Menggunakan Metode Naive Bayes,” J. Rekayasa Elektro Sriwij., vol. 2, no. 2, pp. 151–157, 2021, doi: 10.36706/jres.v2i2.29.
R. Nofitri and J. Eska, “Implementasi Data Mining Klasifikasi C4.5 Dalam Menentukan Kelayakan Pengambilan Kredit,” Semin. Nas. R., vol., no., p., 2018.
F. Akbar, H. W. Saputra, A. K. Maulaya, M. F. Hidayat, and R. Rahmaddeni, “Implementasi Algoritma Decision Tree C4.5 dan Support Vector Regression untuk Prediksi Penyakit Stroke,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 2, no. 2, pp. 61–67, 2022, doi: 10.57152/malcom.v2i2.426.
N. M. Farhan and B. Setiaji, “Indonesian Journal of Computer Science,” Indones. J. Comput. Sci., vol. 12, no. 2, pp. 284–301, 2023, [Online]. Available: http://ijcs.stmikindonesia.ac.id/ijcs/index.php/ijcs/article/view/3135
M. Z. Al-Taie, S. Kadry, and J. P. Lucas, “Online data preprocessing: A case study approach,” Int. J. Electr. Comput. Eng., vol. 9, no. 4, pp. 2620–2626, 2019, doi: 10.11591/ijece.v9i4.pp2620-2626.
A. Putri et al., “Komparasi Algoritma K-NN, Naive Bayes dan SVM untuk Prediksi Kelulusan Mahasiswa Tingkat Akhir,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 3, no. 1, pp. 20–26, 2023, doi: 10.57152/malcom.v3i1.610.
Y. Mardi, “Data Mining : Klasifikasi Menggunakan Algoritma C4.5,” Edik Inform., vol. 2, no. 2, pp. 213–219, 2017, doi: 10.22202/ei.2016.v2i2.1465.
M. Syahril, K. Erwansyah, and M. Yetri, “Penerapan Data Mining Untuk Menentukan Pola Penjualan Peralatan Sekolah Pada Brand Wigglo Dengan Menggunakan Algoritma Apriori,” J-SISKO TECH (Jurnal Teknol. Sist. Inf. dan Sist. Komput. TGD), vol. 3, no. 1, p. 118, 2020, doi: 10.53513/jsk.v3i1.202.
N. W. S. Agustini, D. Priadi, and R. V. Atika, “Profil Kimia dan Aktivitas Antibakteri Fraksi Aktif Nannochloropsis sp. sebagai Senyawa Penghambat Bakteri Penyebab Gangguan Kesehatan Mulut,” J. Pascapanen dan Bioteknol. Kelaut. dan Perikan., vol. 17, no. 1, p. 19, 2022, doi: 10.15578/jpbkp.v17i1.781.
E. Susilowati, M. K. Sabariah, and A. A. Gozali, “Implementasi Metode Support Vector Machine untuk Melakukan Klasifikasi Kemacetan Lalu Lintas Pada Twitter,” E-Proceeding Eng., vol. 2, no. 1, pp. 1478–1484, 2015.
S. Raharjo and E. Winarko, “Klasterisasi, klasifikasi dan peringkasan teks berbahasa indonesia,” Kommit 2014, vol. 8, no. Kommit, pp. 391–401, 2014.
S. Devella, Y. Yohannes, and F. N. Rahmawati, “Implementasi Random Forest Untuk Klasifikasi Motif Songket Palembang Berdasarkan SIFT,” JATISI (Jurnal Tek. Inform. dan Sist. Informasi), vol. 7, no. 2, pp. 310–320, 2020, doi: 10.35957/jatisi.v7i2.289.
Y. S. Nugroho and N. Emiliyawati, “Sistem Klasifikasi Variabel Tingkat Penerimaan Konsumen Terhadap Mobil Menggunakan Metode Random Forest,” J. Tek. Elektro, vol. 9, no. 1, pp. 24–29, 2017.
C. Chen, Tianqi; Guestrin, “XGBoost: A Scalable Tree Boosting System,” in Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2016, pp. 785–794.
C. Bentéjac, A. Csörgő, and G. Martínez-Muñoz, A comparative analysis of gradient boosting algorithms, vol. 54, no. 3. Springer Netherlands, 2021. doi: 10.1007/s10462-020-09896-5.
F. Pratama, Z. Hadryan Nst, Z. Khairi, and L. Efrizoni, “Perbandingan Algoritma Random Forest Dan K-Nearest Neighbor Dalam Klasifikasi Kesehatan Mental Mahasiswa,” J. Ilm. Betrik, vol. 15, no. 1, pp. 31–37, 2024.
M. Azhari, Z. Situmorang, and R. Rosnelly, “Perbandingan Akurasi, Recall, dan Presisi Klasifikasi pada Algoritma C4.5, Random Forest, SVM dan Naive Bayes,” J. Media Inform. Budidarma, vol. 5, no. 2, p. 640, 2021, doi: 10.30865/mib.v5i2.2937.
K. Kristiawan and A. Widjaja, “Perbandingan Algoritma Machine Learning dalam Menilai Sebuah Lokasi Toko Ritel,” J. Tek. Inform. dan Sist. Inf., vol. 7, no. 1, pp. 35–46, 2021, doi: 10.28932/jutisi.v7i1.3182.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2024 Risky Harahap, M. Irpan, M. Azzuhri Dinata, Lusiana Efrizoni, Rahmaddeni
This work is licensed under a Creative Commons Attribution 4.0 International License.