Saya sedang mengembangkan penelitian terkait Named Entity Recognition (NER) untuk ekstraksi informasi dari dokumen resume. Data yang digunakan berupa teks resume berbahasa Inggris yang telah diberi label. Dataset berjumlah 150 (masing masing entitas berjumlah 25) dalam format csv/excel. Label yang digunakan mencakup 6 kategori yaitu Jabatan (JOB_TITLE), WAKTU (DATE), Pendidikan (EDU), PENGHARGAAN (AWARD), SERTIFIKASI (CERT), dan Keterampilan (SKILL).
Saya membutuhkan validator yang memiliki latar belakang terkait untuk membantu melakukan validasi data hasil pelabelan agar label yang diberikan sudah sesuai dengan isi teks resume. Validasi dilakukan dengan memeriksa token atau kata dalam resume, lalu memastikan apakah label entitas yang diberikan sudah benar berdasarkan panduan anotasi yang akan disediakan.
Detail Pekerjaan
Pekerjaan yang dilakukan meliputi:
- Memeriksa hasil pelabelan entitas pada teks resume.
- Mengoreksi label yang salah dan berikan label yang benar pada catatan (tidak valid dengan catatan)
- Mengoreksi label yang benar namun diluar domain pada catatan (valid dengan catatan)













Loading ...
