Biaya Latih AI DeepSeek Cuma Rp 4,8 Miliar

Virgina Maulita Putri - detikInet

Minggu, 21 Sep 2025 13:03 WIB

Jakarta -

DeepSeek, perusahaan kecerdasan buatan (AI) asal China mengungkap biaya yang mereka habiskan untuk melatih model R1 jagoannya. Sesuai klaim sebelumnya, biaya melatih DeepSeek R1 jauh lebih rendah dibandingkan pesaing seperti ChatGPT,

Dalam artikel peer-review yang diterbitkan di jurnal akademik Nature, DeepSeek mengatakan mereka menghabiskan USD 294.000 atau sekitar Rp 4,8 miliar untuk melatih model R1. Artikel itu mencantumkan nama CEO dan pendiri DeepSeek Liang Wenfeng sebagai salah satu penulisnya.

Artikel itu juga mengungkap DeepSeek melatih model R1 menggunakan 512 unit chip Nvidia H800. Artikel versi sebelumnya yang diterbitkan pada Januari 2025 tidak memuat informasi ini.

SCROLL TO CONTINUE WITH CONTENT

Biaya pelatihan untuk large language model yang mengotaki chatbot AI merujuk pada biaya yang dikeluarkan untuk menjalankan sekumpulan chip canggih selama berbulan-bulan guna memproses teks dan kode dalam jumlah besar.

Proses pelatihan AI biasanya membutuhkan biaya yang sangat besar. Pada tahun 2023, CEO OpenAI Sam Altman mengatakan pelatihan model yang mendasari ChatGPT membutuhkan lebih dari USD 100 juta atau sekitar Rp 1,6 triliun.

Sejumlah pernyataan DeepSeek tentang biaya dan teknologi yang digunakan untuk melatih model AI-nya diragukan oleh pejabat dan perusahaan Amerika Serikat.

Chip H800 yang dipakai melatih model R1 dirancang khusus oleh Nvidia untuk pasar China setelah pemerintah AS melarang raksasa chip itu mengekspor GPU AI H100 dan A100 yang lebih bertenaga ke China.

Pada bulan Juni lalu, petinggi AS mengatakan DeepSeek memiliki chip H100 dalam jumlah besar yang diperoleh setelah larangan ekspor diberlakukan pada Oktober 2022. Nvidia saat itu mengatakan DeepSeek menggunakan chip H800 yang didapatkan secara legal, bukan chip H100.

Dalam dokumen pendukung yang menyertai artikel Nature, DeepSek untuk pertama kalinya mengakui memiliki chip A100 yang dipakai untuk tahap persiapan pengembangan model R1. Setelah fase awal ini, model R1 dilatih menggunakan chip H800 selama 80 jam.

"Mengenai penelitian kami terkait DeepSeek-R1, kami menggunakan GPU A100 untuk mempersiapkan eksperimen dengan model yang lebih kecil," tulis peneliti DeepSeek, seperti dikutip dari Reuters, Minggu (21/9/2025).

Video: Korea Selatan Blokir Aplikasi DeepSeek

(vmp/fay)