Kategori Berita
Daerah
Layanan
Top Up & Tagihan
Detik Network
detikInet
Gandeng Nvidia, F5 Bikin Solusi Percepatan Infrastruktur AI Perusahaan

Gandeng Nvidia, F5 Bikin Solusi Percepatan Infrastruktur AI Perusahaan


Anggoro Suryo - detikInet

F5
Foto: Dok. F5
Jakarta -

Perusahaan penyedia keamanan dan distribusi aplikasi, F5, resmi memperluas kolaborasinya dengan Nvidia. Lewat kerja sama ini, keduanya meluncurkan solusi cerdas untuk mempercepat dan mengoptimalkan infrastruktur inferensi AI di tingkat enterprise.

Integrasi terbaru ini menggabungkan solusi F5 BIG-IP Next for Kubernetes dengan Nvidia BlueField-3 DPU (Data Processing Unit). Perpaduan ini menciptakan sebuah lapisan infrastruktur cerdas yang mampu meningkatkan pemrosesan keluaran AI melalui pemanfaatan GPU yang jauh lebih optimal dan minim latensi.

Fokus pada 'Ekonomi Token'

Dalam sistem kerja AI generatif, 'token' adalah satuan keluaran dasar yang terukur--bisa berupa kata, simbol, atau fragmen data. Seiring bergesernya tren dari sekadar eksperimen AI menjadi fase mendulang cuan (monetisasi), volume dan kecepatan produksi token ini menjadi kunci utama efisiensi bisnis.

SCROLL TO CONTINUE WITH CONTENT

Keberhasilan infrastruktur AI kini tak lagi diukur dari seberapa banyak kapasitas GPU yang dipunya, melainkan dari "ekonomi token". Ini mencakup seberapa cepat Time to First Token, biaya per token, hingga berapa potensi pendapatan dari setiap GPU yang menyala.

ADVERTISEMENT

"Infrastruktur AI bukan hanya tentang akses ke GPU atau peningkatan skala implementasinya. Ia telah berevolusi menjadi upaya memaksimalkan output ekonomi per akselerator," jelas Kunal Anand, Chief Product Officer F5, dalam keterangan yang diterima detikINET, Minggu (10/5/2026).

Kunal menambahkan, bersama Nvidia, F5 membantu fasilitas pengembangan AI (AI factory) untuk mengelola produksi token layaknya metrik bisnis yang terukur, sehingga biaya per token bisa ditekan secara signifikan.

Dongkrak Performa Tanpa Ubah Model AI

Peningkatan performa yang ditawarkan kombinasi F5 dan Nvidia ini bukan sekadar klaim di atas kertas. Berdasarkan pengujian yang divalidasi oleh The Tolly Group, integrasi kedua teknologi ini terbukti mampu membuahkan hasil yang masif:

  • Meningkatkan token throughput (jumlah produksi token) hingga 40 persen.
  • Waktu kemunculan token pertama (Time to First Token/TTFT) 61 persen lebih cepat.
  • Menurunkan latensi permintaan secara keseluruhan hingga 34 persen.

Rahasia di balik kecepatan tersebut terletak pada pembagian tugas beban kerja. F5 dan Nvidia memindahkan fungsi berat seperti manajemen jaringan, enkripsi TLS, dan load balancing ke chip Nvidia BlueField-3 DPU.

Langkah pendelegasian tugas ini otomatis membebaskan ruang komputasi GPU, sehingga GPU tersebut bisa fokus 100 persen melakukan tugas utamanya, yakni melakukan inferensi AI secara terus-menerus. Hal yang paling krusial, semua peningkatan kecepatan ini bisa langsung diterapkan tanpa perlu merombak atau memodifikasi model AI yang sudah berjalan.

"Infrastruktur komputasi Nvidia yang dipadukan dengan platform F5 membuka potensi 'tokenomics' AI factory, yakni menghadirkan inferensi yang skalabel dan hemat biaya tanpa perlu melakukan perubahan apa pun pada model," kata Kevin Deierling, SVP Networking Nvidia.

Lewat solusi terintegrasi ini, perusahaan dan penyedia layanan cloud kini dapat berbagi infrastruktur GPU secara aman antar unit bisnis, tanpa perlu khawatir terjadi kebocoran data atau penurunan performa sistem jaringan.




(asj/fay)








Hide Ads
LIVE