hallo, saya sedang membutuhkan sebuah analisis untuk perkuliahan saya yaitu analisis menggunakan rapidminer untuk analisis sentimen ulasan berbahasa indonesia dengan jumlah data sebesar 2412 yang terbagi atas 3 class. yaitu kelas positif = 804, negatif = 804, dan netral = 804
langkah pekerjaan yaitu :
melakukan pembersihan data (data cleaning) menghapus tanda baca dan angka
preprocessing data :
- case folding
- tokenize
- remove stopword
- stemming
- hitung term weighting TF-IDF
- split data yaitu menjadi
skenario 1 : 80% data training dan 20% data testing
skenario 2 : 90% data training dan 10% data testing
- kemudian hitung support vector machine menggunakan kernel RBF (diharapkan menggunakan parameter yang nanti hasilnya dapat mendapatkan akurasi >90%)
untuk pengujiannya menggunakan stratified k-fold cross validation 1-10 serta confussion matrix
jelaskan alur proses yang dilakukan serta parameter yang digunakan dan untuk hasil dapat dikirim berupa file word dan gambar berupa screenshot
silahkan bid project ini (semoga amanah)











Loading ...
