Bukan Sekadar Ganti Nama: 4 Perbedaan Mendasar Antara Data Scientist dan AI Engineer

Bukan Sekadar Ganti Nama: 4 Perbedaan Mendasar Antara Data Scientist dan AI Engineer

Pendahuluan

Selama bertahun-tahun, “data scientist” digadang-gadang sebagai pekerjaan paling seksi di abad ke-21. Namun, belakangan ini muncul penantang baru untuk gelar tersebut: “AI engineer”. Kemunculan peran ini memicu banyak pertanyaan di kalangan industri teknologi.

Apakah AI engineer hanyalah data scientist dengan nama baru? Apa yang sebenarnya membedakan keduanya? Pertanyaan ini menjadi semakin relevan seiring dengan terobosan generative AI yang mengubah lanskap teknologi secara fundamental.

Artikel ini akan mengupas tuntas empat perbedaan mendasar antara kedua peran tersebut, berdasarkan wawasan dari Isaac Key, seorang pakar industri di IBM yang telah beralih peran dari data scientist menjadi AI engineer. Kita akan melihat bagaimana perbedaan ini memengaruhi fokus kerja, bahan baku yang digunakan, perangkat yang diandalkan, hingga proses kerja sehari-hari.

4 Perbedaan Mendasar

1. Fokus Utama: Pencerita Data vs. Pembangun Sistem AI

Perbedaan paling fundamental antara seorang data scientist dan AI engineer terletak pada tujuan akhir dari pekerjaan mereka. Keduanya bekerja dengan data dan model, tetapi hasil yang ingin dicapai sangat berbeda.

  • Data Scientist digambarkan sebagai “pencerita data”. Tugas utama mereka adalah mengambil data mentah dalam jumlah besar yang sering kali berantakan, lalu menerjemahkannya menjadi wawasan yang bermakna menggunakan model matematika. Fokus mereka terbagi menjadi dua:
    • Deskriptif: Menceritakan apa yang telah terjadi melalui analisis data eksplorasi (EDA) atau segmentasi pelanggan.
    • Prediktif: Meramalkan masa depan menggunakan model seperti regresi (untuk memprediksi angka, misal: pendapatan) dan klasifikasi (untuk memprediksi kategori, misal: sukses atau gagal).
  • AI Engineer, di sisi lain, adalah “pembangun sistem AI”. Mereka memanfaatkan foundation models (model fondasi) untuk membangun sistem AI generatif yang mampu mentransformasi proses bisnis. Fokus mereka juga terbagi dua, namun dengan orientasi yang berbeda:
    • Preskriptif: Memberikan rekomendasi tindakan terbaik, seperti menyarankan kampanye pemasaran yang ditargetkan untuk basis pelanggan tertentu.
    • Generatif: Menciptakan sesuatu yang baru, seperti asisten pengkodean (coding assistant), penasihat digital (digital advisor), atau chatbot untuk pencarian informasi percakapan.

“Pada level yang sangat tinggi, anggaplah data scientist sebagai pencerita data… Di sisi lain, anggaplah AI engineer sebagai pembangun sistem AI.”

Perbedaan filosofi ini sangat penting. Peran data scientist lebih berfokus pada analisis untuk memahami masa lalu dan sekarang, sedangkan peran AI engineer berfokus pada penciptaan sistem untuk membangun masa depan.

2. Bahan Baku: Data Terstruktur vs. Data Tidak Terstruktur

Jika data adalah “minyak” baru, maka kedua profesi ini mengebor di ladang yang berbeda. Jenis dan skala data yang menjadi fokus utama mereka sangat kontras.

  • Data Scientist lebih sering bekerja dengan data terstruktur (tabular), seperti tabel dalam database atau spreadsheet. Meskipun mereka juga bisa bekerja dengan data tidak terstruktur, fokus utama mereka cenderung pada data tabular dalam skala ratusan hingga ratusan ribu observasi. Data ini memerlukan proses pembersihan dan pra-pemrosesan yang intensif sebelum dapat digunakan untuk melatih model.
  • AI Engineer, terutama yang bekerja di ranah AI generatif, berfokus pada data tidak terstruktur seperti teks, gambar, video, dan audio. Skala datanya jauh lebih masif. Sebagai contoh, untuk melatih Large Language Model (LLM), dibutuhkan miliaran hingga triliunan token teks—jauh melampaui skala yang biasa ditangani dalam proyek machine learning tradisional.

“Bagi seorang data scientist, ‘minyak’ pilihannya sering kali adalah data terstruktur… Di sisi lain, bagi seorang AI engineer, ‘minyak’ pilihannya terutama adalah data tidak terstruktur seperti teks, gambar, video, file audio, dll.”

Perbedaan fundamental dalam ‘bahan baku’ ini secara alami mengarahkan kedua profesi untuk menggunakan perangkat dan teknik yang berbeda pula, yang membawa kita ke poin berikutnya.

3. Perangkat Kerja: Ratusan Model vs. Satu Model Fondasi

“Kotak perkakas” atau toolbox yang digunakan oleh data scientist dan AI engineer menunjukkan perbedaan pendekatan yang tajam dalam menyelesaikan masalah.

  • Data Scientist memiliki kotak perkakas yang berisi ratusan model dan algoritma yang berbeda. Setiap kasus penggunaan spesifik memerlukan pemilihan model yang tepat. Model-model ini cenderung memiliki cakupan yang lebih sempit, ukuran lebih kecil, dan waktu pelatihan yang relatif singkat (dari detik hingga jam). Mereka dirancang untuk tugas spesifik dan sulit digeneralisasi untuk masalah lain.
  • AI Engineer memiliki “kotak perkakas yang jauh lebih rapi” yang berpusat pada satu jenis model utama: foundation model. Model ini bersifat revolusioner karena merupakan model generalis yang sangat besar (miliaran parameter) dan dapat beradaptasi dengan berbagai tugas tanpa perlu dilatih ulang dari awal. Namun, pelatihan awal model ini membutuhkan sumber daya komputasi yang sangat besar (ratusan GPU) dan waktu yang sangat lama (minggu hingga bulan).

Foundation models bersifat revolusioner karena memungkinkan satu jenis model tunggal untuk digeneralisasi ke berbagai macam tugas tanpa harus dilatih ulang.”

Implikasi dari perbedaan ini sangat signifikan. Data scientist berperan sebagai spesialis yang memilih alat yang tepat untuk setiap masalah unik. Sebaliknya, AI engineer berperan sebagai generalis yang mengadaptasi satu alat super canggih untuk menyelesaikan berbagai macam masalah.

4. Proses Kerja: Membangun dari Nol vs. Memanfaatkan yang Sudah Ada

Alur kerja atau proses pengembangan solusi untuk kedua peran ini juga telah berevolusi secara berbeda, terutama dengan adanya model pra-terlatih (pre-trained models).

  • Proses Data Science yang khas dimulai dari identifikasi kasus penggunaan, dilanjutkan dengan pemilihan dan persiapan data, lalu melatih dan memvalidasi model dari awal menggunakan teknik seperti feature engineering dan hyperparameter tuning. Setelah optimal, model ini kemudian diimplementasikan (deployed) pada sebuah endpoint untuk melakukan prediksi secara real-time.
  • Proses Generative AI juga dimulai dari kasus penggunaan, tetapi dapat langsung melompat ke tahap bekerja dengan model yang sudah dilatih sebelumnya. Hal ini dimungkinkan oleh fenomena “demokratisasi AI”. AI engineer berinteraksi dengan foundation model ini menggunakan serangkaian teknik canggih untuk membangun sistem yang lebih besar, seperti prompt engineering, menghubungkan beberapa prompt secara berantai (chaining prompts), Retrieval-Augmented Generation (RAG), fine-tuning, hingga menciptakan agen otonom (autonomous agents) untuk menalar masalah multi-langkah yang kompleks. Langkah terakhir adalah menyematkan AI ini ke dalam sistem atau alur kerja yang lebih besar, seperti membuat asisten virtual atau membangun aplikasi.

“Apa yang memungkinkan ini adalah fenomena yang disebut demokratisasi AI, yang merupakan kata mewah yang berarti membuat AI lebih mudah diakses secara luas oleh pengguna sehari-hari.”

Pergeseran proses kerja ini mengubah fokus secara fundamental. Alih-alih hanya “membangun model” dari nol, peran AI engineer berpusat pada “merancang interaksi dengan model” dan mengintegrasikannya ke dalam aplikasi bisnis dan alur kerja yang lebih besar dan lebih kompleks.

Penutup

Terobosan dalam AI generatif telah menciptakan perbedaan yang nyata dan signifikan antara peran data scientist dan AI engineer. Perbedaan tersebut mencakup kasus penggunaan, jenis data yang diolah, model yang diandalkan, hingga proses kerja sehari-hari. Ini bukan lagi sekadar perubahan nama, melainkan evolusi peran yang didorong oleh kemajuan teknologi.

Penting untuk diingat bahwa meskipun berbeda, kedua bidang ini masih memiliki area tumpang tindih—misalnya, seorang data scientist mungkin mengerjakan kasus penggunaan preskriptif, atau seorang AI engineer mungkin masih perlu bekerja dengan data terstruktur—dan keduanya terus berkembang dengan sangat cepat. Batasan di antara keduanya bisa jadi akan semakin kabur di masa depan.

Comments

No comments yet. Why don’t you start the discussion?

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *