F5 dan Nvidia Luncurkan Solusi Optimasi Infrastruktur Inferensi AI

Perusahaan keamanan aplikasi F5 memperluas kolaborasi strategis dengan Nvidia melalui peluncuran solusi cerdas untuk mengoptimalkan infrastruktur inferensi AI pada tingkat enterprise, Minggu (10/5/2026). Kerja sama ini bertujuan mempercepat pemrosesan keluaran AI dengan memanfaatkan unit pemrosesan data canggih.

Dilansir dari Detik iNET, integrasi ini menggabungkan teknologi F5 BIG-IP Next for Kubernetes dengan Nvidia BlueField-3 Data Processing Unit (DPU). Sinergi tersebut membentuk lapisan infrastruktur yang diklaim mampu meminimalkan latensi sekaligus memaksimalkan penggunaan GPU dalam sistem AI generatif.

Fokus utama dari pengembangan teknologi ini tertuju pada konsep ekonomi token yang menjadi tolok ukur baru efisiensi bisnis. Kecepatan produksi token, yang mencakup kata atau fragmen data, kini dianggap lebih krusial dibandingkan sekadar kapasitas total GPU yang dimiliki oleh sebuah perusahaan.

Chief Product Officer F5, Kunal Anand, memberikan penjelasan mengenai pergeseran paradigma dalam pembangunan infrastruktur kecerdasan buatan yang kini lebih mengutamakan hasil ekonomi per akselerator.

"Infrastruktur AI bukan hanya tentang akses ke GPU atau peningkatan skala implementasinya. Ia telah berevolusi menjadi upaya memaksimalkan output ekonomi per akselerator," jelas Kunal Anand, Chief Product Officer F5.

Pihak F5 menyatakan bahwa kolaborasi ini akan membantu fasilitas pengembangan AI dalam mengelola metrik produksi agar biaya per token dapat ditekan secara signifikan.

Berdasarkan validasi dari The Tolly Group, integrasi teknologi ini memberikan dampak nyata pada performa sistem. Beberapa peningkatan signifikan yang tercatat meliputi kenaikan throughput token sebesar 40 persen dan percepatan waktu kemunculan token pertama hingga 61 persen.

Kecepatan ini dicapai dengan mendelegasikan fungsi manajemen jaringan, enkripsi TLS, dan load balancing ke chip Nvidia BlueField-3 DPU. Strategi ini membuat GPU memiliki ruang komputasi yang lebih luas untuk fokus sepenuhnya pada tugas inferensi tanpa perlu mengubah model AI yang sudah ada.

SVP Networking Nvidia, Kevin Deierling, menekankan bahwa kombinasi platform ini membuka peluang besar bagi efisiensi biaya operasional di pabrik AI.

"Infrastruktur komputasi Nvidia yang dipadukan dengan platform F5 membuka potensi 'tokenomics' AI factory, yakni menghadirkan inferensi yang skalabel dan hemat biaya tanpa perlu melakukan perubahan apa pun pada model," kata Kevin Deierling, SVP Networking Nvidia.

Melalui solusi terintegrasi ini, penyedia layanan cloud dapat berbagi infrastruktur GPU secara aman antar unit bisnis tanpa risiko kebocoran data. Optimalisasi ini juga diklaim mampu menjaga stabilitas performa sistem jaringan secara keseluruhan.

F5 dan Nvidia Luncurkan Solusi Optimasi Infrastruktur Inferensi AI

Nadia Larasati

Artikel terkait

Rekomendasi