Setelah lebih dari tujuh bulan penantian, Google akhirnya resmi memperkenalkan Gemini 3, generasi terbaru keluarga model AI mereka. Bintang utamanya adalah Gemini 3 Pro, model frontier yang digadang-gadang sebagai "model paling cerdas yang pernah dimiliki Google" dan disebut sebagai langkah besar berikutnya dalam perjalanan menuju Artificial General Intelligence (AGI).
Berbeda dengan sekadar upgrade minor, Gemini 3 digambarkan sebagai "suite of highly-capable, natively multimodal, reasoning models" - rangkaian model penalaran multimodal canggih yang dirancang untuk memahami teks, gambar, audio, dan video secara mendalam dan menyatukan semuanya dalam satu kerangka kerja.
"Kami menghadirkan Gemini 3, model paling cerdas yang kami miliki, yang menggabungkan seluruh kemampuan Gemini untuk membantu Anda mewujudkan berbagai ide." ujar CEO Google & Alphabet Sundar Pichai dikutip dari blog resmi Google.
Arsitektur Baru Berbasis Sparse Mixture-of-Experts
Di balik Gemini 3 Pro, Google mengandalkan arsitektur sparse mixture-of-experts (MoE) yang dibangun di atas Transformer. Alih-alih mengaktifkan seluruh lebih dari 1 triliun parameter setiap kali menjawab, model ini hanya "membangunkan" sebagian kecil expert yang paling relevan untuk tugas tertentu. Dengan cara ini, kapasitas model bisa sangat besar, tetapi biaya komputasinya tetap lebih efisien.
Pendekatan ini berbeda dengan model-model besar lain seperti GPT atau Claude yang masih mengandalkan arsitektur padat (dense). Google menganalogikan Gemini 3 Pro seperti sebuah organisasi besar: tidak semua karyawan diundang ke setiap rapat, hanya tim yang kompeten di topik itu yang dilibatkan.
Seluruh proses pelatihan Gemini 3 Pro dilakukan di atas Tensor Processing Units (TPU) milik Google dengan stack perangkat lunak JAX dan ML Pathways. Model ini dilatih pada kombinasi data dokumen web, repositori kode, gambar, audio, video, data berlisensi, data interaksi pengguna, serta konten sintetis yang dihasilkan model lain.
Semua itu kemudian difilter untuk kualitas dan keamanan, termasuk penyaringan konten pornografi, kekerasan ekstrem, dan materi yang melanggar regulasi keselamatan anak.
Ungguli Benchmark Frontier Model
Salah satu pembaruan paling signifikan adalah jendela konteks 1 juta token-setara dengan sekitar 700.000 kata atau 10 novel penuh. Kemampuan ini memungkinkan analisis dokumen besar, kode kompleks, atau kombinasi video-teks dalam satu sesi.
Versi model card terarsip menunjukkan Gemini 3 Pro memiliki output maksimal 64.000 token dan knowledge cutoff Januari 2025. Google mengakui model masih bisa mengalami hallusinasi serta timeout pada kasus tertentu.
Google menyebut Gemini 3 Pro memberikan lompatan besar dibanding Gemini 2.5 Pro, terutama dalam kemampuan reasoning.
Beberapa hasil benchmark utama:
- Humanity's Last Exam:
- Gemini 3 Pro: 37,5%
- Gemini 2.5 Pro: 21,6%
- GPQA Diamond: hingga 91,9%
- ARC-AGI-2: sekitar 31,1%, dan 45,1% pada mode Deep Think dengan eksekusi kode
- MMMU-Pro: sekitar 81%
- Video-MMMU: sekitar 87,6%
- SimpleQA Verified: 72,1%
Google mengklaim Gemini 3 Pro kini memimpin di berbagai benchmark reasoning dan multimodal, mengungguli model-model frontier lain seperti Claude Sonnet 4.5, Grok 4.1, dan OpenAI GPT-5.1.
Kombinasi hasil benchmark ini menjadi dasar klaim Google bahwa Gemini 3 Pro berada di posisi terdepan untuk kemampuan reasoning dan multimodal di kelasnya.
Fokus Besar di Coding dan "Agentic AI"
Google menekankan bahwa Gemini 3 Pro adalah model terbaik mereka untuk coding dan agentic AI.
Hasil uji eksternal dan internal menunjukkan:
- LMArena: 1501 Elo (peringkat teratas)
- WebDev Arena: 1487 Elo
- Terminal-Bench 2.0: 54,2%
- SWE-bench Verified: 76,2%
Dalam praktik, Gemini 3 Pro mampu menghasilkan prototipe game stealth 3D dari satu prompt-sesuatu yang belum dilakukan model sebelumnya. Antarmuka coding Google kini juga memberikan saran langkah lanjutan, debugging, hingga opsi deploy aplikasi.
Google turut memperkenalkan Google Antigravity, platform IDE agentic baru yang memungkinkan agent Gemini:
- merencanakan solusi dari awal hingga akhir,
- menulis dan menjalankan kode di terminal atau browser,
- memvalidasi hasil secara otonom,
- membangun aplikasi kompleks tanpa intervensi manual.
Simak Video "Video: Google soal Penggunaan AI di Dunia Pendidikan Rawan Kecurangan"
(afr/afr)