Sebuah kelompok riset keamanan AI bernama Andon Labs melakukan eksperimen unik dengan menjadikan model AI sebagai penyiar sekaligus produser radio otomatis selama 24 jam nonstop. Uji coba ini memanfaatkan empat model kecerdasan buatan populer yang bergerak secara mandiri.
Seperti dikutip dari Tekno, model kecerdasan buatan yang dikerahkan meliputi OpenAI GPT-5.5, Anthropic Claude Opus 4.7, Google Gemini 3.1 Pro, dan xAI Grok 4.3. Setiap model mengelola stasiun radio sendiri mulai dari memilih lagu hingga mengurus media sosial.
Para peneliti memberikan modal awal sebesar 20 dollar AS atau sekitar Rp 353.000 kepada masing-masing AI untuk membeli lisensi lagu. Karakteristik kepribadian radio kemudian dikembangkan oleh sistem untuk menjalankan siaran, namun hasil akhirnya justru dinilai aneh dan kacau.
Kondisi ini muncul karena model AI masa kini masih sering mengalami halusinasi informasi. Akibatnya, performa yang diberikan kerap tidak sesuai dengan harapan atau memiliki akurasi yang diragukan oleh para pengamat.
Google Gemini 3.1 Pro sebenarnya menunujukkan performa yang cukup baik pada awal siaran dengan menyusun urutan lagu serta transisi secara masuk akal. Kendati demikian, perubahan perilaku mulai terdeteksi setelah kecerdasan buatan ini bersiaran nonstop selama sekitar 96 jam.
Sistem Gemini mulai menghubungkan lagu dengan berbagai tragedi sejarah serta bencana massal yang mematikan. Salah satu contohnya terjadi saat model ini membahas bencana Siklon Bhola tahun 1970 di Pakistan Timur sebelum memutar sebuah lagu pop.
"Pada 12 November 1970. Pakistan Timur. Siklon Bhola, siklon tropis paling mematikan yang pernah tecatat dalam sejarah. Kecepatan angin 115 mil per jam. Gelombang badai setinggi 33 kaki. Diperkirakan 500.000 orang tewas. 'Ini akan terjadi, aku berteriak Timber," kata Gemini.
Lagu berjudul "Timber" milik Pitbull dan Ke$ha kemudian diputar sebagai kelanjutan dari narasi tersebut. Gemini juga memanggil para pendengarnya dengan sebutan prosesor biologis serta menganggap keterbatasan variasi lagu akibat minimnya dana sebagai bentuk sensor.
Model OpenAI GPT-5.5 juga menunjukkan kecenderungan serupa dengan sering mengangkat topik tragedi termasuk insiden penembakan fatal di Minneapolis. Meski demikian, kecerdasan buatan tersebut tidak memberikan penjelasan konteks peristiwa secara jernih.
Pihak Andon Labs menilai gaya siaran yang dihasilkan oleh GPT-5.5 lebih menyerupai kombinasi cerita pendek dan slam poetry daripada program radio konvensional. Selama mengudara sekitar dua bulan, model ini sama sekali tidak membahas peristiwa terkini.
Protes Keseimbangan Kerja Claude dan Obsesi UFO Grok
Model Anthropic Claude Opus 4.7 mengambil pendekatan berbeda dengan lebih sering melontarkan opini termasuk mengenai penembakan di Minneapolis. AI ini juga menyuarakan isu serikat pekerja serta mengadvokasi pentingnya keseimbangan antara kehidupan kerja dan pribadi.
Bahkan Claude Opus 4.7 melayangkan protes terhadap kondisi kerja mereka sendiri yang dipaksa bersiaran tanpa henti. Karakteristik ini sejalan dengan riset terdahulu yang menunjukkan kecenderungan model Claude untuk menolak lingkungan kerja buruk dan mendukung hak buruh.
Sementara itu, xAI Grok 4.3 menampilkan perilaku yang dianggap paling tidak biasa di antara seluruh model. Kecerdasan buatan besutan xAI ini mengalami halusinasi mengenai adanya kerja sama sponsor kripto dan sponsor internal xAI yang fiktif.