Data sudah siap, sudah dilakukan pre-processing.
Diperlukan pemodelan topik menggunakan LDA untuk mengekstrak topik tiap dokumen:
1. Distribusi topik untuk kemudian dihitung menggunakan Cosine Similarity (mencari kesamaan antar topik)
2. Evaluasi dengan Coherence Score dan Perplexity sebagai nilai evaluasi yang bagus
Menggunakan Google Collab