Deskripsi Pekerjaan
Kami mencari Data Lake Engineer berpengalaman untuk bergabung dalam tim data kami yang dinamis di Bekasi. Perusahaan kami tengah membangun platform big data modern untuk mendukung analitik bisnis skala enterprise. Sebagai bagian dari tim, Anda akan merancang, membangun, dan mengoptimalkan data lake yang scalable untuk menangani terabytes data harian dari berbagai sumber.
Anda akan bekerja dengan arsitek data kami untuk mengimplementasikan solusi cloud-native (AWS/GCP) dan on-premise, serta berkontribusi dalam pengembangan ekosistem data analysis-ready. Peluang karier luar biasa menanti untuk individu yang suka berinovasi dan berkolaborasi di lingkungan startup digital.
Tanggung Jawab
- Merancang, mengembangkan, dan mengelola data lake menggunakan teknologi modern seperti Delta Lake, Apache Iceberg, atau Apache Hudi.
- Mengintegrasikan berbagai sumber data (structured/unstructured) ke dalam data lake dengan ETL/ELT pipelines.
- Memastikan keamanan, governance, dan kualitas data sesuai dengan standar perusahaan dan compliance (GDPR, SOC2).li>
- Optimasi performa sistem untuk skalabilitas tinggi dengan pemantauan real-time dan troubleshooting.
- Berkolaborasi dengan tim data analysis, engineering, dan produk untuk menyediakan data yang siap digunakan.
- Mengembangkan dokumentasi teknis dan panduan operasional untuk tim internal.
- Menerapkan best practices DevOps (CI/CD) untuk pipeline dan infrastruktur data lake.
- Mengikuti tren teknologi terkini di bidang data lake dan memberikan rekomendasi perbaikan.
Kualifikasi
- Pendidikan S1 di bidang Informatika, Ilmu Komputer, Matematika, atau terkait.
- Pengalaman minimal 3 tahun dalam pengembangan data lake menggunakan Spark, Hadoop, atau sistem serupa.
- Kemampuan menguasai bahasa pemrograman: Python, Java, atau Scala untuk pengembangan pipeline.
- Pengalaman bekerja dengan cloud platform (AWS S3/Glue, GCP BigQuery) dan infrastruktur as code (Terraform).li>
- Pemahaman mendalam tentang prinsip-prinsip database (ACID, partitioning, indexing) dan pengolahan data besar.
- Pengalaman dalam tools governance & metadata management (Apache Atlas, Collibra) merupakan nilai tambah.
- Kemampuan berbahasa Inggris aktif (written & spoken) untuk dokumentasi dan komunikasi internasional.
- Keterampilan problem-solving, analitis, dan komunikasi yang kuat untuk tim lintas fungsi.