• (022) 6902 1117

Backend & AI Engineer (Freelance / Project-Based)

 

Kami membangun platform Knowledge Management berbasis AI — konsepnya mirip Wikipedia internal organisasi, dengan kemampuan tambahan berupa AI Assistant yang bisa menjawab pertanyaan berdasarkan dokumen yang telah diupload.

Sistem ini bukan platform analitik, bukan surveillance tool, dan bukan sistem kompleks dengan banyak integrasi. Fokusnya satu: menjadi repositori pengetahuan yang cerdas — dokumen diupload, diorganisir, dan bisa ditanya menggunakan bahasa alami.

Keamanan ditangani via VPN (akses hanya dari jaringan VPN organisasi) dan MFA pada login. Tidak diperlukan security layer yang kompleks di luar itu.

Frontend dibangun terpisah menggunakan Lovable + Next.js. Kandidat fokus sepenuhnya pada backend API, AI pipeline, dan infrastruktur.


Apa yang Dibangun

1. Knowledge Repository Sistem penyimpanan dan organisasi dokumen yang terstruktur. Setiap item (dokumen atau media) memiliki:

  • Judul
  • Deskripsi
  • Tags (bisa multiple)
  • Kategori / folder hierarkis
  • Level klasifikasi akses (siapa yang boleh melihat)
  • Metadata otomatis: tanggal upload, uploader, tipe file, ukuran

Tipe konten yang didukung: PDF, DOCX, TXT, gambar (JPG, PNG), dan video (disimpan sebagai referensi/link dengan metadata, bukan diproses kontennya).

2. Document Processing Pipeline Setiap dokumen yang diupload diproses secara otomatis di background:

  • OCR untuk dokumen scan atau gambar
  • Text extraction untuk PDF dan DOCX
  • Chunking teks menjadi segmen optimal
  • Embedding setiap chunk menggunakan model multilingual
  • Indexing ke vector database untuk pencarian semantik

3. AI Assistant (RAG) Antarmuka tanya jawab natural language yang menjawab berdasarkan dokumen yang ada di sistem:

  • Query dalam Bahasa Indonesia
  • Sistem mencari chunk paling relevan dari vector database
  • LLM merangkai jawaban berdasarkan chunk tersebut
  • Setiap jawaban disertai referensi: nama dokumen, judul, dan bagian yang relevan
  • Jika tidak ada dokumen relevan ditemukan, AI menolak menjawab dan menyatakan data tidak tersedia — tidak mengarang jawaban

4. Search

  • Semantic search sebagai fitur utama: pencarian berdasarkan makna, bukan hanya kata kunci
  • Filter search berdasarkan tag, kategori, tanggal upload, tipe file, dan level akses

5. User & Access Management

  • Login dengan MFA (Time-based OTP)
  • Role-based access: minimal 3–4 level akses (contoh: viewer, contributor, editor, admin)
  • Setiap dokumen memiliki level klasifikasi yang menentukan siapa yang bisa melihatnya
  • Audit log: siapa mengakses dokumen apa dan kapan

6. Infrastruktur

  • Seluruh sistem berjalan on-premise via Docker Compose
  • Akses dibatasi melalui VPN — tidak ada endpoint yang terbuka ke internet publik
  • File storage menggunakan MinIO
  • Background processing menggunakan Celery + Redis

Kualifikasi Wajib

  • Pengalaman backend Python, familiar dengan FastAPI
  • Mahir PostgreSQL: schema design, relasi, query dasar
  • Pernah membangun atau mengeksplorasi RAG pipeline secara nyata — setidaknya pernah membuat sistem yang benar-benar berjalan, bukan hanya mengikuti tutorial
  • Memahami konsep embedding dan vector search
  • Pengalaman Docker — bisa setup multi-service environment dengan Docker Compose
  • Mampu bekerja mandiri tanpa tech lead — ini adalah satu-satunya engineer di proyek ini
  • Komunikatif: update mingguan, responsif dalam hari kerja

Kualifikasi Diutamakan

  • Pernah menggunakan Qdrant, pgvector, atau vector DB lain
  • Pernah menjalankan Ollama atau model LLM lokal
  • Familiar dengan LangChain atau LlamaIndex
  • Pengalaman OCR pipeline untuk dokumen campuran
  • Pernah setup MinIO sebagai object storage
  • Tinggal di Tangerang atau sekitarnya

Silahkan Bid dan japri. Sertakan tiga hal berikut:

1. Portfolio atau GitHub — proyek backend Python dan/atau AI yang pernah dikerjakan. Kode nyata lebih bernilai dari daftar teknologi di CV.

2. Penjelasan singkat — ceritakan satu proyek paling relevan. Fokus pada bagian yang Anda kerjakan sendiri. Jika pernah menyentuh RAG atau vector search, ceritakan konteksnya.

3. Rate dan ketersediaan — rate per bulan atau per milestone, kapan bisa mulai, dan berapa jam per minggu yang bisa dialokasikan.


Python PostgreSQL Google Cloud Developer Data Analysis Data Mining Data Integration API Gateway Github Artificial Intelligence

Published Budget: Rp 8,000,000 - 15,000,000
Published Date: 06/06/2026 13:35:59 WIB
Select Deadline: 06/07/2026 13:35:59 WIB
Finish Days: 30
Project Status: Published
Bid Count: 8
Need Weekly Report:

Project Owner

Accepted Worker

Bid masih terbuka.

  Place New Bid   Ask Owner   Chat

      User Bids

 

 


Live Chat