1. Data di akses dari https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE18732, data terdiri dari 118 baris dan 25770 kolom. coding menggunakan pemrograman R, tools RStudio.
2. Data di preprocess menggunakan log transformasi kemudian di normalisasi menggunakan quantile normalization.
3. Data di reduksi dimensinya menggunakan Singular Value Decomposition (SVD)
4. Data di Seleksi fiturnya menggunakan Information gain.
5. Data di bagi menjadi 70% data training dan 30% data testing
6. Data di klasifikasi menggunakan Naive bayes classifier.
7. output tujuannya adalah klasifikasi mana gen yang diabetes mellitus tipe II dan mana gen yang normal
8. hasil klasifikasi di hitung akurasi, presisi, recall dll menggunakan confusion matrix.