Deskripsi Pekerjaan
PT Solusi Teknologi Digital Jaya, perusahaan transformasi digital terdepan di Indonesia, membuka lowongan menarik untuk posisi Insinyur Kekacauan (Chaos Engineer) di Bekasi. Bergabunglah dengan tim kami yang berdedikasi untuk membangun sistem digital tahan uji yang memberikan ketangguhan luar biasa terhadap berbagai skenario kegagalan.
Kami mencari profesional berpengalaman yang mampu mengidentifikasi kelemahan sistem sebelum sistem tersebut gagal dihadapan pelanggan. Dengan demikian, Anda tidak hanya akan memberi dampak langsung pada stabilitas operasional perusahaan, tetapi juga menjadi bagian dari inisiatif strategis yang akan membentuk masa depan layanan digital di Indonesia.
Imbalan kompetitif, lingkungan kerja inovatif, dan kesempatan untuk mengembangkan karir secara eksponensial menanti Anda di sini. Apakah Anda siap untuk menjelajahi batas-batas kegagalan sistem dan menemukan solusi yang membuat sistem lebih tangguh? Mari bergabung!
Tanggung Jawab
- Merancang dan Melaksanakan Percobaan Kekacauan: Memimpin dan mengeksekusi eksperimen simulasi kegagalan sistem guna mengidentifikasi kerentanan kritis dalam infrastruktur dan aplikasi.
- Menganalisis Dampak Kegagalan: Mengukur dan melaporkan dampak kegagalan yang disengaja terhadap kinerja sistem, ketersediaan, dan pengalaman pengguna secara kuantitatif.
- Berkolaborasi dengan Tim DevOps & SRE: Bekerja erat dengan tim operasional untuk menerapkan saran perbaikan dan memperkuat arsitektur sistem berdasarkan temuan eksperimen.
- Mengembangkan Alat dan Frameworks: Merancang serta mengembangkan alat bantu otomatis dan frameworks internal untuk mempercepat proses pengujian ketangguhan sistem.
- Menyajikan Laporan Temuan & Rekomendasi: Menyusun dan menyajikan laporan eksklusif yang dapat ditindaklanjuti atau presentasi interaktif bagi stakeholder untuk pengambilan keputusan strategis.
- Berkontribusi terhadap Budaya Resilience: Membangun dan mempromosikan budaya ketangguhan sistem melalui pelatihan, sharing knowledge, dan implementasi praktik terbaik di seluruh organisasi.
- Mengelola Jurnal Percobaan Kekacauan: Mendokumentasikan setiap percobaan yang dilakukan, memastikan transparansi, dan memfasilitasi pemulangan pembelajaran bagi tim engineering.
- Memantau Tren Industri: Terus menerus mengevaluasi perkembangan terbaru dalam bidang Chaos Engineering dan menerapkannya untuk meningkatkan metodologi yang digunakan.
Kualifikasi
- Pengalaman Relevan Minimal 3 Tahun: Berpengalaman sebagai DevOps Engineer, SRE, atau peran terkait dengan tanggung jawab dalam stabilitas sistem dan pengujian ketangguhan.
- Pemahaman Kuat tentang Infrastruktur Cloud: Mahir menggunakan layanan AWS, GCP, atau Azure serta memiliki pengalaman dengan container dan orkestrasi (Kubernetes, Docker).
- Skill Analitis Tingkat Tinggi: Mampu menganalisis data kinerja sistem, log, serta metrik untuk mengidentifikasi tren dan anomali yang mungkin mengindikasikan kegagalan potensial.
- Studi Ilmu Komputer atau Rekayasa Perangkat Lunak: Lulusan strata-1 (S1) di bidang Ilmu Komputer, Teknik Informatika, atau bidang teknik relevan lainnya. Sertifikasi profesional merupakan nilai tambah besar.
- Komunikasi dan Kolaborasi yang Luar Biasa: Memiliki skill interpersonal yang kuat untuk menjelaskan konsep teknis kepada non-teknis dan bekerja dengan tim lintas fungsi secara efektif.
- Kepemimpinan Proyek dan Inisiatif: Pernah memimpin proyek berskala menengah hingga besar, serta memiliki pengalaman dalam menyusun serta melaksanakan roadmap pengembangan sistem.
- Kemampuan Menulis Kode dan Skrip:** Mahir menulis dan men-debug kode dalam bahasa scripting (Python, Bash) serta memiliki pengetahuan dasar dalam bahasa pemrograman lainnya.
- Semangat Belajar dan Inovasi:** Terus menerus ingin belajar teknologi baru dan metodologi pengujian ketangguhan serta bersedia bereksperimen dengan konsep dan tools yang belum teruji.