Setelah lebih dari tujuh bulan penantian, Google akhirnya resmi memperkenalkan Gemini 3, generasi terbaru keluarga model AI mereka. Bintang utamanya adalah Gemini 3 Pro, model frontier yang digadang-gadang sebagai "model paling cerdas yang pernah dimiliki Google" dan disebut sebagai langkah besar berikutnya dalam perjalanan menuju Artificial General Intelligence (AGI).
Berbeda dengan sekadar upgrade minor, Gemini 3 digambarkan sebagai "suite of highly-capable, natively multimodal, reasoning models" - rangkaian model penalaran multimodal canggih yang dirancang untuk memahami teks, gambar, audio, dan video secara mendalam dan menyatukan semuanya dalam satu kerangka kerja.
"Kami menghadirkan Gemini 3, model paling cerdas yang kami miliki, yang menggabungkan seluruh kemampuan Gemini untuk membantu Anda mewujudkan berbagai ide." ujar CEO Google & Alphabet Sundar Pichai dikutip dari blog resmi Google.
SCROLL TO CONTINUE WITH CONTENT
Arsitektur Baru Berbasis Sparse Mixture-of-Experts
Di balik Gemini 3 Pro, Google mengandalkan arsitektur sparse mixture-of-experts (MoE) yang dibangun di atas Transformer. Alih-alih mengaktifkan seluruh lebih dari 1 triliun parameter setiap kali menjawab, model ini hanya "membangunkan" sebagian kecil expert yang paling relevan untuk tugas tertentu. Dengan cara ini, kapasitas model bisa sangat besar, tetapi biaya komputasinya tetap lebih efisien.
Pendekatan ini berbeda dengan model-model besar lain seperti GPT atau Claude yang masih mengandalkan arsitektur padat (dense). Google menganalogikan Gemini 3 Pro seperti sebuah organisasi besar: tidak semua karyawan diundang ke setiap rapat, hanya tim yang kompeten di topik itu yang dilibatkan.
Seluruh proses pelatihan Gemini 3 Pro dilakukan di atas Tensor Processing Units (TPU) milik Google dengan stack perangkat lunak JAX dan ML Pathways. Model ini dilatih pada kombinasi data dokumen web, repositori kode, gambar, audio, video, data berlisensi, data interaksi pengguna, serta konten sintetis yang dihasilkan model lain.
Semua itu kemudian difilter untuk kualitas dan keamanan, termasuk penyaringan konten pornografi, kekerasan ekstrem, dan materi yang melanggar regulasi keselamatan anak.
Ungguli Benchmark Frontier Model
Salah satu pembaruan paling signifikan adalah jendela konteks 1 juta token-setara dengan sekitar 700.000 kata atau 10 novel penuh. Kemampuan ini memungkinkan analisis dokumen besar, kode kompleks, atau kombinasi video-teks dalam satu sesi.
Versi model card terarsip menunjukkan Gemini 3 Pro memiliki output maksimal 64.000 token dan knowledge cutoff Januari 2025. Google mengakui model masih bisa mengalami hallusinasi serta timeout pada kasus tertentu.
Google menyebut Gemini 3 Pro memberikan lompatan besar dibanding Gemini 2.5 Pro, terutama dalam kemampuan reasoning.
Beberapa hasil benchmark utama:
- Humanity's Last Exam:
- Gemini 3 Pro: 37,5%
- Gemini 2.5 Pro: 21,6%
- GPQA Diamond: hingga 91,9%
- ARC-AGI-2: sekitar 31,1%, dan 45,1% pada mode Deep Think dengan eksekusi kode
- MMMU-Pro: sekitar 81%
- Video-MMMU: sekitar 87,6%
- SimpleQA Verified: 72,1%
Benchmark Gemini 3 Foto: Google |
Google mengklaim Gemini 3 Pro kini memimpin di berbagai benchmark reasoning dan multimodal, mengungguli model-model frontier lain seperti Claude Sonnet 4.5, Grok 4.1, dan OpenAI GPT-5.1.
Kombinasi hasil benchmark ini menjadi dasar klaim Google bahwa Gemini 3 Pro berada di posisi terdepan untuk kemampuan reasoning dan multimodal di kelasnya.
Fokus Besar di Coding dan "Agentic AI"
Google menekankan bahwa Gemini 3 Pro adalah model terbaik mereka untuk coding dan agentic AI.
Hasil uji eksternal dan internal menunjukkan:
- LMArena: 1501 Elo (peringkat teratas)
- WebDev Arena: 1487 Elo
- Terminal-Bench 2.0: 54,2%
- SWE-bench Verified: 76,2%
Dalam praktik, Gemini 3 Pro mampu menghasilkan prototipe game stealth 3D dari satu prompt-sesuatu yang belum dilakukan model sebelumnya. Antarmuka coding Google kini juga memberikan saran langkah lanjutan, debugging, hingga opsi deploy aplikasi.
Google turut memperkenalkan Google Antigravity, platform IDE agentic baru yang memungkinkan agent Gemini:
- merencanakan solusi dari awal hingga akhir,
- menulis dan menjalankan kode di terminal atau browser,
- memvalidasi hasil secara otonom,
- membangun aplikasi kompleks tanpa intervensi manual.
Mode Deep Think: Level Penalaran Lebih Tinggi
Selain varian standar, Google memperkenalkan Gemini 3 Deep Think, mode reasoning intensif yang diberikan lebih dulu kepada penguji keamanan.
Peningkatan yang diklaim:
- Humanity's Last Exam: naik ke 41,0%
- GPQA Diamond: 93,8%
- ARC-AGI (dengan tool): 45,1%, rekor baru untuk benchmark tersebut
Deep Think dirancang untuk pemecahan masalah yang memerlukan analisis bertingkat atau berjangka panjang.
Performa Deep Think Gemini 3 Foto: undefined |
Kemampuan Belajar, Kreativitas, dan Perencanaan
Dengan multimodalitas native dan konteks ekstra besar, Gemini 3 Pro dirancang sebagai model all-in-one untuk belajar, membuat konten, maupun merencanakan aktivitas kompleks.
Contoh skenario penggunaan:
- Mengubah resep tulisan tangan dari berbagai bahasa menjadi buku masak digital.
- Mengolah makalah akademik atau video kuliah menjadi flashcard dan visualisasi.
- Menganalisis video pertandingan olahraga dan membuat rencana latihan.
- Menjalankan Mode AI di Google Search untuk menghadirkan rangkuman visual, simulasi interaktif, dan tata letak dinamis yang dihasilkan langsung dari kueri pengguna.
Di sisi produktivitas, agent Gemini dapat menyelesaikan alur kerja multi-step, seperti merapikan inbox Gmail, menyusun jadwal, hingga menyiapkan itinerary perjalanan.
Ketersediaan: Gratis untuk Dicoba
Gemini 3 tersedia untuk berbagai segmen pengguna:
- Public preview gratis di Google AI Studio
- Gemini API, Gemini CLI, Vertex AI, dan Google Antigravity
- Platform pihak ketiga seperti Cursor, GitHub, JetBrains, Replit, dan lainnya
- Aplikasi Gemini untuk pengguna Pro dan Ultra
Gemini 3 Pro belum tersedia di aplikasi Gemini untuk semua pengguna umum pada hari peluncuran.
Google menegaskan Gemini 3 adalah model paling aman yang pernah mereka rilis, dengan peningkatan pada:
- resistensi terhadap prompt injection,
- penurunan sycophancy,
- perlindungan terhadap penyalahgunaan dan serangan siber.
Model ini telah melalui evaluasi dalam kerangka Frontier Safety Framework Google dan diuji lembaga eksternal seperti UK AISI serta firma keamanan independen.
Namun, tantangan pasar tetap besar. OpenAI saat ini mengklaim 800 juta pengguna ChatGPT setiap minggu, sementara aplikasi Gemini memiliki sekitar 650 juta pengguna bulanan. Google masih harus membuktikan bahwa keunggulan teknis Gemini 3 dapat diterjemahkan menjadi adopsi pengguna yang lebih luas.
Simak Video "Video: Google soal Penggunaan AI di Dunia Pendidikan Rawan Kecurangan"
[Gambas:Video 20detik]
(afr/afr)













































