Pelatihan model kecerdasan buatan (AI) berukuran besar semakin mahal dan boros energi. Riset terbaru dari DeepSeek menawarkan pendekatan baru untuk mengurangi pemborosan tersebut, dengan membuat proses pelatihan model AI menjadi lebih stabil dan dapat diprediksi.
Dalam makalah riset terbarunya, DeepSeek memperkenalkan metode bernama manifold-constrained hyperconnection (mHC). Pendekatan ini tidak difokuskan pada peningkatan performa mentah, melainkan pada stabilitas pelatihan model AI berskala besar yang selama ini kerap menjadi sumber masalah di industri, demikian dikutip detikINET dari Gizmochina, Minggu (4/1/2026).
DeepSeek menyoroti fakta bahwa banyak model AI canggih gagal di tengah proses pelatihan. Ketika kegagalan terjadi, perusahaan harus mengulang pelatihan dari awal, yang berarti membuang waktu berminggu-minggu, konsumsi listrik dalam jumlah besar, serta ribuan jam komputasi GPU. Kondisi ini membuat biaya pengembangan AI melonjak tajam.
SCROLL TO CONTINUE WITH CONTENT
Melalui mHC, DeepSeek berupaya menjaga perilaku model agar tetap berada dalam batas yang lebih terkontrol selama proses pelatihan. Dengan stabilitas yang lebih baik, risiko kegagalan di tengah jalan dapat ditekan, sehingga pelatihan model memiliki peluang lebih besar untuk selesai tanpa perlu pengulangan berulang.
Pendekatan ini dinilai relevan di tengah meningkatnya konsumsi energi pusat data untuk pelatihan AI. Meski mHC tidak secara langsung membuat GPU lebih hemat daya, metode ini berpotensi mengurangi energi yang terbuang akibat pelatihan yang gagal. Dengan kata lain, efisiensi dicapai lewat pengurangan pemborosan sumber daya, bukan lewat perubahan perangkat keras.
DeepSeek juga menilai stabilitas pelatihan dapat mengurangi ketergantungan industri pada pendekatan "brute force", seperti menambah jumlah GPU, memperbesar kapasitas memori, atau memperpanjang waktu pelatihan hanya demi menjaga model tetap berjalan. Jika pelatihan lebih stabil, kebutuhan akan sumber daya berlebih bisa ditekan.
Dalam makalahnya, DeepSeek tidak mengklaim bahwa mHC akan langsung menyelesaikan persoalan kelangkaan perangkat keras atau lonjakan konsumsi energi global. Namun, riset ini diposisikan sebagai langkah penting untuk memaksimalkan pemanfaatan infrastruktur yang sudah ada.
Seiring skala model AI yang terus membesar, pendekatan seperti mHC dinilai berpotensi membantu pengembang melatih model yang lebih kuat dengan biaya dan konsumsi energi makin terkendali. Bagi industri AI, efisiensi semacam ini semakin krusial di tengah tekanan ekonomi dan lingkungan yang kian meningkat.
(asj/hps)