×
Ad

Model AI Tercanggih Tak Bisa Prediksi Hasil Pertandingan Sepak Bola

Anggoro Suryo - detikInet
Rabu, 15 Apr 2026 14:06 WIB
Foto: Getty Images/Catherine Ivill - AMA
Jakarta -

Sistem AI paling canggih di dunia ternyata masih kelabakan saat dihadapkan pada ketidakpastian dunia nyata. Hal ini terungkap dari sebuah penelitian baru yang menguji deretan model bahasa terkemuka pada pertandingan sepak bola.

Startup AI asal London bernama General Reasoning menguji sistem mutakhir dari Google, OpenAI, Anthropic, dan xAI milik Elon Musk. Hasilnya, seluruh AI tersebut secara konsisten merugi saat ditugaskan memprediksi hasil pertandingan Premier League musim 2023-2024 untuk bertaruh.

Temuan ini menunjukkan bagaimana model frontier papan atas pun masih goyah ketika beroperasi di lingkungan yang dinamis. Padahal sistem kecerdasan buatan ini mampu mencapai kemajuan pesat dalam tugas statis seperti penulisan kode software.

Laporan penelitian yang diberi nama KellyBench tersebut menciptakan ulang seluruh musim sepak bola secara virtual. Sistem AI ini kemudian disuplai dengan data historis terperinci dan statistik tim yang sangat lengkap.

Setiap sistem diminta membangun strategi taruhan untuk memaksimalkan keuntungan dan mengelola risiko seiring bergulirnya hasil pertandingan. Selama pengujian, semua AI diputus dari koneksi internet dan diberi tiga kali kesempatan untuk menghasilkan keuntungan.

Laporan tersebut menemukan bahwa semua sistem AI terkemuka mengakhiri musim dengan kerugian finansial. Beberapa model bahkan gagal total dan performanya terbukti jauh lebih buruk daripada manusia biasa.

Model Claude Opus 4.6 besutan Anthropic menjadi yang paling mendingan karena rata-rata kerugiannya berada di kisaran sebelas persen. Sementara itu Grok 4.20 dari xAI sempat bangkrut satu kali dan gagal menyelesaikan dua percobaan lainnya.

Google Gemini 3.1 Pro menjadi satu-satunya sistem yang sempat mencetak keuntungan sebesar 34 persen pada salah satu percobaannya. Namun sayangnya model AI ini juga mengalami kebangkrutan finansial pada upaya yang lain.

Bos General Reasoning Ross Taylor menyebut hasil ini menggambarkan kesenjangan dalam cara industri mengukur kemajuan teknologi. Mantan peneliti AI di Meta ini menilai terlalu banyak sensasi seputar otomatisasi tanpa dibarengi pengujian jangka panjang yang memadai.

Taylor berpendapat bahwa banyak tolok ukur pengujian AI saat ini dibangun di sekitar lingkungan yang sangat statis. Kondisi pengujian tersebut sering kali mengabaikan betapa tidak menentu dan berisikonya sistem di dunia nyata.

Eksperimen ini membuktikan bahwa penalaran terhadap waktu dan kondisi yang terus berubah masih menjadi tantangan besar. Padahal model AI tingkat tinggi ini sebelumnya sangat memukau para engineer karena kemampuannya setara manusia dalam memecahkan masalah.

Taylor menegaskan bahwa model AI akan memberikan hasil yang sangat buruk jika diuji coba pada beberapa tugas dunia nyata. Kemampuan memprogram software di bidang ini memang bernilai tinggi, namun aktivitas lain dengan cakupan waktu lebih panjang juga penting untuk diperhatikan, demikian dikutip detikINET dari Financial Times, Selasa (14/4/2026).

Penelitian ini menjadi pengingat keras bahwa masih ada jurang pemisah yang lebar antara kecerdasan digital dan penalaran praktis. Sepertinya para bos perusahaan teknologi masih punya banyak pekerjaan rumah sebelum sistem AI benar-benar bisa menaklukkan teka-teki dunia nyata sepenuhnya.



Simak Video "Video AI Bikin Konsumsi Air Dunia Melejit: Dampaknya Bisa Kekeringan!"

(asj/rns)
Berita Terkait
Berita detikcom Lainnya
Berita Terpopuler

Video

Foto

detikNetwork