51动漫

51动漫 Official Website

Mengatasi Nilai yang Hilang Menggunakan Metode Imputasi pada Klasifikasi Tuberkulosis

Foto by Ciputra Hospital

Tuberkulosis (TB) ialah suatu penyakit yang bisa menular dan bersifat mematikan, menurut World Health Organization (WHO) TB termasuk penyakit berbahaya karena mejadi salah satu dari sepuluh penyebab kematian di seluruh dunia. Indonesia menjadi salah satu negara tertinggi yang terinfeksi penyakit Tuberkulosis [1] dan [2]. Penyakit ini berasal dari berbagai strain mikobakteria, yaitu Mycobacterium tuberculosis. Indonesia merupakan salah satu negara yang memiliki kepadatan penduduk tertinggi di dunia dengan angka Tuberculosis (TB) yang begitu tinggi. Penyakit TB ini menjadi sangat serius karena penularannya sangat mudah melalui udara yaitu droplet yang berasal dari seorang penderita TB yang batuk atau bersin.

Dalam mendiagnosa sebuah penyakit seringkali terjadi missing data sehingga mengakibatkan terjadinya kesalahan peneliti dalam proses pengumpulan data, sehingga penelitian ini mengusulkan metode imputasi Most Commom Imputation dalam mengatasi data yang hilang. Teknik untuk menangani missing value yaitu dengan Imputasi Rata-rata. Dimana atribut yang mengandung nilai yang hilang diganti dengan menghitung mean dari nilai yang tidak hilang tersebut.

Klasifikasi merupakan teknik penting dalam data mining dalam yang mana mencakup di semua bidang kehidupan [6]. Data mining adalah proses mengekstraksi data di dalam database dengan menggunakan teknik tertentu untuk mendapatkan pengetahuan atau informasi baru. Teknik klasifikasi ini dapat digunakan untuk membantu dalam mengidentifikasi penyakit, sehingga teknik ini cocok untuk diterapkan pada diagnose. Untuk klasifikasi data penyakit TB pada Kabupaten Bangkalan Indonesia, yang terdiri dari 886 data, metode yang digunakan adalah Na茂ve bayes yang dibandingkan dengan Regresi Logistik. Untuk pembagian data pelatihan dan pengujian penelitian ini menggunakan multiple train and test k-fold cross validation dengan jumlah k=10.

Berdasarkan uji coba penelitian menggunakan metode Imputasi mean lebih baik dibandingkan dengan metode imputasi satu dalam mengisi data yang hilang untuk kasus ini dengan rata-rata akurasi 97.36% dan F1 score 95.01% lebih baik dibandingkan imputasi satu rata-rata akurasi 97.35% dan F1 score 94.35% pada metode na茂ve bayes. Untuk klasifikasi TB, metode na茂ve bayes menghasikan rata-rata akurasi 97.36% dan F1 score 95.01% lebih baik dibandingkan dengan metode regresi logistic dalam mengklasifikasikan tuberculosis dengan tingkat akurasi 97.36% dengan F1 score sebesar 89.58%.

Penulis: Dr. Miswanto, M.Si.

Jurnal: OVERCOMING MISSING VALUES USING IMPUTATION METHODS IN THE CLASSIFICATION OF TUBERCULOSIS

AKSES CEPAT