Kami membangun platform Knowledge Management berbasis AI — konsepnya mirip Wikipedia internal organisasi, dengan kemampuan tambahan berupa AI Assistant yang bisa menjawab pertanyaan berdasarkan dokumen yang telah diupload.
Sistem ini bukan platform analitik, bukan surveillance tool, dan bukan sistem kompleks dengan banyak integrasi. Fokusnya satu: menjadi repositori pengetahuan yang cerdas — dokumen diupload, diorganisir, dan bisa ditanya menggunakan bahasa alami.
Keamanan ditangani via VPN (akses hanya dari jaringan VPN organisasi) dan MFA pada login. Tidak diperlukan security layer yang kompleks di luar itu.
Frontend dibangun terpisah menggunakan Lovable + Next.js. Kandidat fokus sepenuhnya pada backend API, AI pipeline, dan infrastruktur.
Apa yang Dibangun
1. Knowledge Repository Sistem penyimpanan dan organisasi dokumen yang terstruktur. Setiap item (dokumen atau media) memiliki:
- Judul
- Deskripsi
- Tags (bisa multiple)
- Kategori / folder hierarkis
- Level klasifikasi akses (siapa yang boleh melihat)
- Metadata otomatis: tanggal upload, uploader, tipe file, ukuran
Tipe konten yang didukung: PDF, DOCX, TXT, gambar (JPG, PNG), dan video (disimpan sebagai referensi/link dengan metadata, bukan diproses kontennya).
2. Document Processing Pipeline Setiap dokumen yang diupload diproses secara otomatis di background:
- OCR untuk dokumen scan atau gambar
- Text extraction untuk PDF dan DOCX
- Chunking teks menjadi segmen optimal
- Embedding setiap chunk menggunakan model multilingual
- Indexing ke vector database untuk pencarian semantik
3. AI Assistant (RAG) Antarmuka tanya jawab natural language yang menjawab berdasarkan dokumen yang ada di sistem:
- Query dalam Bahasa Indonesia
- Sistem mencari chunk paling relevan dari vector database
- LLM merangkai jawaban berdasarkan chunk tersebut
- Setiap jawaban disertai referensi: nama dokumen, judul, dan bagian yang relevan
- Jika tidak ada dokumen relevan ditemukan, AI menolak menjawab dan menyatakan data tidak tersedia — tidak mengarang jawaban
4. Search
- Semantic search sebagai fitur utama: pencarian berdasarkan makna, bukan hanya kata kunci
- Filter search berdasarkan tag, kategori, tanggal upload, tipe file, dan level akses
5. User & Access Management
- Login dengan MFA (Time-based OTP)
- Role-based access: minimal 3–4 level akses (contoh: viewer, contributor, editor, admin)
- Setiap dokumen memiliki level klasifikasi yang menentukan siapa yang bisa melihatnya
- Audit log: siapa mengakses dokumen apa dan kapan
6. Infrastruktur
- Seluruh sistem berjalan on-premise via Docker Compose
- Akses dibatasi melalui VPN — tidak ada endpoint yang terbuka ke internet publik
- File storage menggunakan MinIO
- Background processing menggunakan Celery + Redis
Kualifikasi Wajib
- Pengalaman backend Python, familiar dengan FastAPI
- Mahir PostgreSQL: schema design, relasi, query dasar
- Pernah membangun atau mengeksplorasi RAG pipeline secara nyata — setidaknya pernah membuat sistem yang benar-benar berjalan, bukan hanya mengikuti tutorial
- Memahami konsep embedding dan vector search
- Pengalaman Docker — bisa setup multi-service environment dengan Docker Compose
- Mampu bekerja mandiri tanpa tech lead — ini adalah satu-satunya engineer di proyek ini
- Komunikatif: update mingguan, responsif dalam hari kerja
Kualifikasi Diutamakan
- Pernah menggunakan Qdrant, pgvector, atau vector DB lain
- Pernah menjalankan Ollama atau model LLM lokal
- Familiar dengan LangChain atau LlamaIndex
- Pengalaman OCR pipeline untuk dokumen campuran
- Pernah setup MinIO sebagai object storage
- Tinggal di Tangerang atau sekitarnya
Silahkan Bid dan japri. Sertakan tiga hal berikut:
1. Portfolio atau GitHub — proyek backend Python dan/atau AI yang pernah dikerjakan. Kode nyata lebih bernilai dari daftar teknologi di CV.
2. Penjelasan singkat — ceritakan satu proyek paling relevan. Fokus pada bagian yang Anda kerjakan sendiri. Jika pernah menyentuh RAG atau vector search, ceritakan konteksnya.
3. Rate dan ketersediaan — rate per bulan atau per milestone, kapan bisa mulai, dan berapa jam per minggu yang bisa dialokasikan.








Loading ...
