Google memperkenalkan model kecerdasan buatan (AI) baru bernama Gemini Omni dalam ajang tahunan Google I/O 2026 di Mountain View, California, AS, pada Selasa (19/5/2026) pagi waktu setempat, untuk memperluas kemampuan multimodal ke pembuatan video generatif.
Peluncuran teknologi any-to-any yang menerima input teks, gambar, audio, hingga video menjadi konten baru ini dilansir dari Tekno. Kehadiran Gemini Omni diklaim sebagai langkah lanjutan dari Nano Banana, model AI terdahulu yang fokus pada pembuatan dan pengeditan gambar.
Melalui integrasi berbagai input tersebut, pengguna dapat memproduksi video AI secara lebih realistis dan konsisten.
"Dengan Omni, Anda dapat menggabungkan gambar, audio, video, dan teks sebagai input untuk menghasilkan video berkualitas tinggi yang didukung oleh pengetahuan dunia nyata milik Gemini," tulis Google.
Pihak pengembang menjelaskan bahwa Gemini Omni memiliki kemampuan mengedit video hanya lewat percakapan bahasa alami. Kecerdasan buatan ini akan terus mengingat setiap instruksi agar karakter, objek, hingga suasana dalam video tetap konsisten meski mengalami revisi berulang kali.
Model AI ini juga dibekali pemahaman simulasi gerakan fisik seperti gravitasi, energi kinetik, dan dinamika fluida yang lebih baik. Selain itu, terdapat fitur Avatars untuk membuat avatar digital menggunakan wajah dan suara asli pengguna, serta penyematan watermark digital SynthID demi mengurangi risiko penyalahgunaan konten.
Varian pertama yang dirilis dari keluarga ini adalah Gemini Omni Flash. Akses teknologi tersebut kini mulai tersedia secara global untuk pelanggan Google AI Plus, Pro, dan Ultra melalui aplikasi Gemini dan Google Flow, serta hadir tanpa biaya tambahan bagi pengguna YouTube Shorts dan aplikasi YouTube Create mulai minggu ini.