Riset Oumi Temukan Ketidakakuratan Informasi pada Google AI Overview

Riset Oumi Temukan Ketidakakuratan Informasi pada Google AI Overview

Pengguna mesin pencari kini sering menjumpai rangkuman informasi otomatis melalui fitur Google AI Overview yang berada di baris teratas hasil pencarian. Dilansir dari Tekno, fitur yang aktif sejak Mei 2024 ini dirancang untuk meringkas jawaban dari berbagai situs web agar pengguna tidak perlu membuka banyak laman.

Meskipun mempermudah akses informasi, kualitas akurasi fitur ini terus menjadi sorotan. Laporan terbaru dari perusahaan riset AI, Oumi, mengungkapkan adanya celah ketidakakuratan yang signifikan pada hasil rangkuman yang diproduksi oleh kecerdasan buatan milik Google tersebut.

Oumi mencatat bahwa secara umum sembilan dari sepuluh informasi yang disajikan Google AI Overview memang akurat. Namun, satu kesalahan dari sepuluh rangkuman tetap menjadi kekhawatiran besar mengingat skala pencarian Google yang mencapai lima triliun kueri setiap tahunnya.

Berdasarkan rata-rata tersebut, Oumi memperkirakan Google berpotensi memberikan puluhan juta jawaban keliru setiap jam. Hal yang lebih mengkhawatirkan adalah temuan bahwa lebih dari 50 persen informasi yang dianggap akurat ternyata tidak sepenuhnya sesuai dengan referensi situs web yang dicantumkan.

Analisis Oumi menggunakan alat benchmark SimpleQA menemukan beberapa pola ketidakakuratan yang unik. Salah satunya adalah ketidaksesuaian tanggal sejarah, seperti saat sistem menyebut museum Bob Marley dibuka tahun 1987, padahal fakta menunjukkan pembukaan terjadi pada 11 Mei 1986.

Dalam kasus lain, AI Google mampu mengidentifikasi situs web yang benar namun salah dalam melakukan penafsiran data. Contohnya terlihat saat sistem salah menyebutkan letak geografis sebuah sungai di North Carolina meski menggunakan sumber referensi pariwisata yang kredibel.

Oumi juga menemukan situasi di mana Google AI Overview memberikan jawaban yang benar, namun disertai dengan detail tambahan yang salah. Hal ini terjadi pada pencarian mengenai usia kematian atlet baseball Dick Drago, di mana tanggal kematiannya terus-menerus disebut secara keliru sebagai konteks tambahan.

Perkembangan Gemini dan Respons Google

Riset ini membandingkan dua versi sistem AI yang digunakan, yaitu Gemini 2 pada Oktober tahun lalu dan Gemini 3 pada Februari tahun ini. Hasil pengujian terhadap 4.326 pencarian menunjukkan peningkatan akurasi dari 85 persen pada Gemini 2 menjadi 91 persen pada Gemini 3.

Google sendiri telah menyertakan catatan peringatan pada fitur tersebut yang berbunyi, "AI dapat membuat kesalahan, jadi periksa kembali jawabannya." Namun, juru bicara Google Ned Adriance menilai riset Oumi memiliki kekurangan serius karena menggunakan alat uji dari OpenAI.

"Studi ini memiliki kekurangan serius. Ini tidak mencerminkan apa yang sebenarnya dicari orang di Google," kata Ned Adriance.

Pihak Google mengeklaim bahwa AI Overviews lebih akurat dibandingkan sistem Gemini yang beroperasi sendiri karena fitur ini mengambil informasi langsung dari mesin pencari sebelum merespons. Namun, data internal mereka pernah menunjukkan bahwa Gemini 3 sendiri menghasilkan informasi tidak akurat sebanyak 28 persen.

Pratik Verma selaku CEO Okahu menyarankan agar masyarakat tidak bergantung pada satu sumber informasi saja. Pengguna diharapkan tetap melakukan verifikasi mandiri dengan membandingkan jawaban AI terhadap sumber-sumber lain untuk memastikan kebenaran data yang diterima.

"Jangan pernah mempercayai satu sumber saja. Selalu bandingkan apa yang Anda dapatkan dengan sumber lain." kata Pratik.

Artikel terkait

Rekomendasi