Model AI Tercanggih Tak Bisa Prediksi Hasil Pertandingan Sepak Bola

Foto: Getty Images/Catherine Ivill - AMA

Jakarta -

Sistem AI paling canggih di dunia ternyata masih kelabakan saat dihadapkan pada ketidakpastian dunia nyata. Hal ini terungkap dari sebuah penelitian baru yang menguji deretan model bahasa terkemuka pada pertandingan sepak bola.

Startup AI asal London bernama General Reasoning menguji sistem mutakhir dari Google, OpenAI, Anthropic, dan xAI milik Elon Musk. Hasilnya, seluruh AI tersebut secara konsisten merugi saat ditugaskan memprediksi hasil pertandingan Premier League musim 2023-2024 untuk bertaruh.

Temuan ini menunjukkan bagaimana model frontier papan atas pun masih goyah ketika beroperasi di lingkungan yang dinamis. Padahal sistem kecerdasan buatan ini mampu mencapai kemajuan pesat dalam tugas statis seperti penulisan kode software.

Laporan penelitian yang diberi nama KellyBench tersebut menciptakan ulang seluruh musim sepak bola secara virtual. Sistem AI ini kemudian disuplai dengan data historis terperinci dan statistik tim yang sangat lengkap.

Setiap sistem diminta membangun strategi taruhan untuk memaksimalkan keuntungan dan mengelola risiko seiring bergulirnya hasil pertandingan. Selama pengujian, semua AI diputus dari koneksi internet dan diberi tiga kali kesempatan untuk menghasilkan keuntungan.

Laporan tersebut menemukan bahwa semua sistem AI terkemuka mengakhiri musim dengan kerugian finansial. Beberapa model bahkan gagal total dan performanya terbukti jauh lebih buruk daripada manusia biasa.

Model Claude Opus 4.6 besutan Anthropic menjadi yang paling mendingan karena rata-rata kerugiannya berada di kisaran sebelas persen. Sementara itu Grok 4.20 dari xAI sempat bangkrut satu kali dan gagal menyelesaikan dua percobaan lainnya.

Google Gemini 3.1 Pro menjadi satu-satunya sistem yang sempat mencetak keuntungan sebesar 34 persen pada salah satu percobaannya. Namun sayangnya model AI ini juga mengalami kebangkrutan finansial pada upaya yang lain.

Bos General Reasoning Ross Taylor menyebut hasil ini menggambarkan kesenjangan dalam cara industri mengukur kemajuan teknologi. Mantan peneliti AI di Meta ini menilai terlalu banyak sensasi seputar otomatisasi tanpa dibarengi pengujian jangka panjang yang memadai.

Taylor berpendapat bahwa banyak tolok ukur pengujian AI saat ini dibangun di sekitar lingkungan yang sangat statis. Kondisi pengujian tersebut sering kali mengabaikan betapa tidak menentu dan berisikonya sistem di dunia nyata.

Eksperimen ini membuktikan bahwa penalaran terhadap waktu dan kondisi yang terus berubah masih menjadi tantangan besar. Padahal model AI tingkat tinggi ini sebelumnya sangat memukau para engineer karena kemampuannya setara manusia dalam memecahkan masalah.

Taylor menegaskan bahwa model AI akan memberikan hasil yang sangat buruk jika diuji coba pada beberapa tugas dunia nyata. Kemampuan memprogram software di bidang ini memang bernilai tinggi, namun aktivitas lain dengan cakupan waktu lebih panjang juga penting untuk diperhatikan, demikian dikutip detikINET dari Financial Times, Selasa (14/4/2026).

Penelitian ini menjadi pengingat keras bahwa masih ada jurang pemisah yang lebar antara kecerdasan digital dan penalaran praktis. Sepertinya para bos perusahaan teknologi masih punya banyak pekerjaan rumah sebelum sistem AI benar-benar bisa menaklukkan teka-teki dunia nyata sepenuhnya.

Simak Video "Video AI Bikin Konsumsi Air Dunia Melejit: Dampaknya Bisa Kekeringan!"

(asj/rns)

Komentar

Model AI Tercanggih Tak Bisa Prediksi Hasil Pertandingan Sepak Bola

AI Claude Lakukan Pemerasan, Ternyata Belajar dari Internet

Pertaruhan Ratusan Juta Dolar Mark Zuckerberg Lewat AI Muse Spark

Abaikan Protes Karyawan, Google Izinkan Militer AS Pakai AI Gemini

Google Gagalkan Eksploitasi Zero-Day yang Diciptakan Pakai AI

Apa Itu Claude AI? Ini Pengertian, Fungsi, dan Cara Kerjanya

Google Akan Lepas 32 Juta Nyamuk Rekayasa, Ada Misi Besar di Baliknya

Bos Intelijen Inggris Klaim Terus Diserang Rusia Pakai AI

10 Foto yang Tampak Normal, Tapi Jadi Kelam Setelah Tahu Kebenarannya

Nvidia Bakal Punya Sumber Pemasukan Baru Selain GPU, Masuk Pasar CPU

Wajib Klaim! 3 Kode Redeem Wuthering Waves Ini Kasih Banyak Hadiah

Video

Video Menyulap Jembatan Merah Klungkung Jadi 'Landasan Pacu' Pesawat

Video: Muncul Prediksi Ada Tahun dengan Rekor Suhu Tertinggi di Rentang 2026-2030

Video: Dahsyatnya Ledakan Roket Blue Origin dari Berbagai Sudut Pandang

Video Daftar SIM Card Wajib Rekam Wajah, Komdigi: Cepat Kurang dari 1 Menit

Foto

Maguire Dicoret dari Piala Dunia, Netizen Pertanyakan Tuchel

Ryzen AI 400 Series Usung Performa AI Lebih Kencang