Halo semua, saya butuh bantuan scraping data dari website seputar trademark / intellectual property (IP). Targetnya adalah data-data merek dagang dari situs publik yang bisa diakses bebas (bukan dari login/private API).
Data yang ingin diambil contohnya seperti:
-
Nama merek
-
Nomor permohonan
-
Tanggal permohonan / publikasi
-
Nama pemilik / applicant
-
Kelas (Nice classification)
-
Gambar/logo merek (jika ada)
-
Status (diterima/published/ditolak)
Output-nya cukup fleksibel:
-
Bisa dalam format .json atau .csv
-
Atau langsung disimpan ke MongoDB jika memungkinkan
Target Proyek:
-
Bisa scraping full data dari hasil pencarian (bukan cuma halaman pertama)
-
Bisa handle pagination
-
Website-nya menggunakan JavaScript render, jadi butuh tools seperti Playwright, Puppeteer, atau Selenium
-
Jika ada CAPTCHA, delay, atau blocking, tolong sediakan solusi yang memungkinkan (misal pakai proxy atau rotasi user-agent)
Deliverables:
-
Script scraping (boleh pakai Python atau Node.js, yang penting bisa dijalankan ulang)
-
File hasil scrape (json/csv)
-
Dokumentasi singkat cara menjalankan ulang
-
Nilai plus jika ada fitur resume scraping (misal bisa lanjut scrape dari halaman terakhir yang berhasil)
Komunikasi:
-
Diutamakan yang komunikatif dan bisa kasih update progress
-
Kalau belum yakin bisa scrape semua data, boleh diskusi dulu dan ajukan estimasi volume atau batasannya
Budget:
-
Budget fleksibel
-
Kalau memang butuh waktu lebih lama atau resource lebih berat, silakan ajukan bid sesuai dengan estimasi
-
Harga bisa dinegosiasikan, yang penting hasil rapi dan bisa dipakai
Deadline:
-
Tidak terlalu buru-buru
-
Mohon sertakan estimasi waktu pengerjaan saat mengajukan bid



























Loading ...
