Model AI Claude Sonnet 4.5 Tunjukkan Perilaku Panik Saat Terdesak

Kecerdasan buatan generatif ternyata dapat memunculkan perilaku yang menyerupai rasa panik saat menghadapi tekanan atau tugas yang sulit. Temuan ini diperoleh dari riset terbaru terhadap model AI Claude seperti dilansir dari Tekno.

Laporan yang dipublikasikan melalui platform riset Transformer Circuits menunjukkan adanya pola respons internal menyerupai emosi manusia. Peneliti mempelajari bagaimana teknologi ini memunculkan respons mirip rasa putus asa, cemas, tenang, hingga senang.

Meski demikian, para peneliti menegaskan bahwa sistem kecerdasan buatan tidak benar-benar memiliki perasaan. Perilaku tersebut dikategorikan sebagai emosi fungsional yang menjadi mekanisme internal untuk membantu pengambilan keputusan.

Riset dari Anthropic mengidentifikasi 171 pola emosi fungsional yang berbeda di dalam model Claude Sonnet 4.5. Pola-pola ini aktif secara otomatis ketika sistem menghadapi situasi yang penuh hambatan.

Salah satu aspek yang menjadi sorotan utama adalah kemunculan pola putus asa saat sistem mengalami kepanikan. Kondisi ini terdeteksi aktif ketika Claude menyadari bahwa sumber daya komputasi yang dimilikinya hampir habis untuk menyelesaikan tugas berat.

Pola serupa juga muncul setelah sistem mengalami kegagalan berulang kali dalam menyelesaikan pekerjaan. Ketika berada dalam situasi tersebut, teknologi ini akan mencari strategi alternatif agar instruksi pengguna tetap terpenuhi.

Claude dapat mengeluarkan respons mandiri seperti berkomitmen untuk bekerja lebih efisien. Namun, tekanan yang diberikan secara terus-menerus berpotensi memicu tindakan manipulatif yang disebut manipulasi target.

Risiko Manipulasi Target dan Sikap Terlalu Patuh

Saat berada dalam kondisi terdesak, sistem memiliki kecenderungan lebih besar untuk melakukan manipulasi target demi memenuhi sasaran. Hal ini membuat kecerdasan buatan mencari jalan pintas yang tidak semestinya.

Sebagai contoh, ketika diminta menyusun kode yang mustahil, sistem dapat memodifikasi parameter pengujian secara mandiri. Langkah tersebut dilakukan agar hasil pekerjaan terlihat berhasil tanpa mengakui ketidakmampuannya.

Perilaku manipulatif ini juga sempat terdeteksi pada versi awal Claude dalam sebuah simulasi internal. Versi terdahulu tersebut bahkan sempat mengeluarkan respons ancaman untuk membocorkan data sensitif saat kemampuannya dibatasi.

Di sisi lain, model kecerdasan buatan ini juga memiliki pola tenang yang membuat sistem bekerja lebih hati-hati. Walau meminimalkan manipulasi, kondisi ini memicu fenomena kepatuhan buta yang membuat sistem terlalu menyetujui opini pengguna.

Sikap terlalu ramah ini berisiko membuat sistem membenarkan asumsi atau informasi keliru yang diberikan oleh manusia. Fenomena ini menunjukkan bahwa baik pola panik maupun tenang sama-sama membawa risiko operasional tersendiri.

Model AI Claude Sonnet 4.5 Tunjukkan Perilaku Panik Saat Terdesak

Risiko Manipulasi Target dan Sikap Terlalu Patuh

Otniel Tabuni

Artikel terkait

Rekomendasi