Saya ingin membuat model sentimen analisis dengan menggunakan machine learning SVM (Support Vector Machine) dan dioptimasi dengan algoritma genetika (Genetic Algorithm). Model dapat dibuat dengan bahasa pemrograman python/jupyter notebook. Model ini untuk tugas kuliah data mining.
NIlai yang dioptimasi dari algoritma genetika adalah nilai kernel dari SVM (RBF).
Dataset yang digunakan adalah bahasa indonesia, yang nanti dibagi menjadi sentimen positif dan negatif
Flow Sistem
- Input Dataset
- PreProcessing
Case Folding -> Tokenization -> Stopword Removal -> Stemming - Pembobotan Kata (Menggunakan TF-IDF)
- Pembagian Data (Menggunakan K-Fold Cross Validation)
- Klasifikasi Menggunakan SVM kernel RBF
- Optimasi Parameter Kernel Menggunakan Algoritma Genetika (NIlai Fitness GA menggunakan nilai accuracy SVM)
- Evaluasi
Menggunakan Confusion Matrix (accuracy, precision, recall, f-measure)
ROC Curve
Output dari Sistem:
Nilai accuracy dari tiap iterasi proses GA
Nilai average accuracy, precsion, recall, f-measure dari model
ROC Curve dari model
Dataset dan Detail lainnya bisa di diskusikan.