Penerapan Dizcretization dan Teknik Bagging Untuk Meningkatkan Akurasi Klasifikasi Berbasis Ensemble pada Algoritma C4.5 dalam Mendiagnosa Diabetes

  • Mirqotussa’adah Mirqotussa’adah Jurusan Ilmu Komputer, FMIPA, Universitas Negeri Semarang
  • Much Aziz Muslim Jurusan Ilmu Komputer, FMIPA, Universitas Negeri Semarang
  • Endang Sugiharti Jurusan Ilmu Komputer, FMIPA, Universitas Negeri Semarang
  • Budi Prasetiyo Computer Science Department, FMIPA, Universitas Negeri Semarang
  • Siti Alimah Jurusan Biologi, FMIPA, Universitas Negeri Semarang
##plugins.pubIds.doi.readerDisplayName## https://doi.org/10.24843/LKJITI.2017.v08.i02.p07

Abstrak

Pada bidang kesehatan, data mining dapat dimanfaatkan untuk memprediksi suatu penyakit dari data rekam medis pasien, diantaranya diabetes. Ada beberapa model data mining salah satunya klasifikasi. Di bidang klasifikasi,  ada banyak cabang yang berkembang yaitu pohon keputusan (decision tree). Salah satu decision tree yang populer adalah C4.5. Dalam riset ini, data yang digunakan adalah pima indian diabetes dataset yang diambil dari UCI repository of machine learning. Pada dataset ini seluruh atributnya bertipe numerik yang bersifat continuous dan untuk menangani data continuous digunakan discretization. Akurasi sangat penting dalam pengklasifikasian, ensemble method adalah metode yang digunakan untuk meningkatkan akurasi algoritma klasifikasi dengan membangun beberapa classifier dari data training. Dari hasil penelitian, dengan menerapkan discretization dan teknik bagging untuk klasifikasi berbasis ensemble pada algoritma C4.5 dapat meningkatkan akurasi sebesar 6,26%. Dengan akurasi awal 68,61%, setelah diterapkan discretization dan teknik bagging menjadi 74,87%.

##plugins.generic.usageStats.downloads##

##plugins.generic.usageStats.noStats##

Referensi

[1] Das R, “A comparison of multiple classification methods for diagnosis of Parkinson disease”, Expert Systems with Applications, vol. 37, no 2, pp.1568-1572, 2010.
[2] Tsai, C. J., Lee, C. I. & Yang, W. P., “A Discretization Algorithm Based on Class-Attribute Contingency Coefficient”, Information Sciences, vol. 178, no. 3, pp.714-731, 2008.
[3] Muzakir, A., & Wulandari, R. A, “Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree”, Scientific Journal of Informatics, vol. 3 no. 1, pp.19-26, 2016.
[4] Nuwangi, S., Oruthotaarachchi, C. R., Tilakaratna, J. & Caldera, H. A, “Utilization Of Data Mining Techniques In Knowledge Extraction For Diminution Of Diabetes”. Proceeding of 2010 2th Vaagdevi International Conference on Information Technology For Real World Problems (VCON) pp.3-8. 2010.
[5] Al-Ibrahim, A. 2011. Discretization of Continuous Attributes in Supervised Learning algorithms. The Research Bulletin of Jordan ACM-ISWSA. pp.158-166.
[6] Kerber, R. 1992. Chimerge: Discretization of numeric attributes. In Proceedings of the tenth national conference on Artificial intelligence. Aaai Press. 123-128.
[7] Dash, R., Paramguru, R. L., & Dash, R, “Comparative analysis of supervised and unsupervised discretization techniques”, International Journal of Advances in Science and Technology, vol. 2, no. 3, pp.29-37, 2011.
[8] Nurcahyani, Arissa Aprilia, & Ristu Saptono, “Identifikasi Kualitas Beras dengan Citra Digital”. Scientific Journal of Informatics, vol. 2, no.1, pp.63-72, 2016.
[9] Tan, Pang, N., Michael, S. & Vipin, K. 2006. Introduction to Datamining. Boston: Pearson Addison Wesley.
[10] Somantri, O., Sasmito, G. W., & Sungkar, M. S, “Optimalisasi Neural Network dengan Bootstrap Aggregating (Bagging) untuk Penentuan Prediksi Harga Listrik”, Scientific Journal of Informatics, vol. 1, no.2, pp.185-192, 2015.
[11] Gorunescu, F., Data Mining: Concepts and Techniques, Verlag Berlin Heidelberg: Springer, 2011.
[12] Prasetyo, E, Data Mining: Mengolah Data Menjadi Informasi Menggunakan Matlab, Yogyakarta: CV. Andi Offset, 2014.
[13] Han, J., Micheline, K., & Jian, P, Data mining: Concepts and Techniques (3th ed.), Waltham, MA: Elsevier/Morgan Kaufmann, 2012.
Diterbitkan
2017-08-07
##submission.howToCite##
MIRQOTUSSA’ADAH, Mirqotussa’adah et al. Penerapan Dizcretization dan Teknik Bagging Untuk Meningkatkan Akurasi Klasifikasi Berbasis Ensemble pada Algoritma C4.5 dalam Mendiagnosa Diabetes. Lontar Komputer : Jurnal Ilmiah Teknologi Informasi, [S.l.], p. 135-143, aug. 2017. ISSN 2541-5832. Tersedia pada: <http://103.29.196.112/index.php/lontar/article/view/32405>. Tanggal Akses: 04 mar. 2026 doi: https://doi.org/10.24843/LKJITI.2017.v08.i02.p07.
Bagian
Articles