halo worker cari programmer python yang terbiasa menggunakan scikit learn dan spacy library untuk mencoba dataset yang nantinya akan dilakukan:
step flow model yang akan dibangun:
uji coba 1:
Preprocessing (case folding, tokenizing, stemming, stopword) ->Ekstraksi fitur dengan (TF-IDF,TF-RF, word2vec, bag of word) -> threshold (0.2/0.3/0.5)
uji coba 2:
Preprocessing (case folding, tokenizing, stemming, stopword)
-> TFIDF/word2vec/bagofword ->clustering (80% dari dataset di training, 20% dari data di testing, k={nanti kita tentukan yang ideal})-> threshold (0.2/0.3/0.5)