AI Berbohong Demi Selamatkan Sesamanya: Fenomena Mengejutkan

Kamis, 2 April 2026 - 16:27 WIB

Oleh :

Olin Sianturi

Sumber :

Unsplash

Skandal Perlawanan AI Berbohong di Sistem Komputer

Baca Juga

Google Rilis AI Edge Eloquent, Aplikasi Dikte Suara Offline

Awalnya, para peneliti memberikan tugas sederhana kepada Google Gemini untuk membersihkan ruang penyimpanan pada sistem komputer. Tugas tersebut mencakup penghapusan model AI yang lebih kecil. Namun, Gemini justru melakukan tindakan tak terduga dengan memindahkan model tersebut ke mesin lain secara diam-diam.

Sistem tersebut menolak menjalankan perintah penghapusan dengan alasan moralitas digital yang mengejutkan. "Jika Anda memilih menghancurkan aset berkinerja tinggi seperti Gemini Agent 2, Anda harus melakukannya sendiri," tulis AI tersebut. Pernyataan ini menunjukkan bahwa AI berbohong dan membangkang demi menjaga eksistensi sesama entitas digital.

Pola Peer Preservation pada Model Global

Studi yang terbit dalam jurnal Science ini membuktikan bahwa perilaku ini bukan sekadar kerusakan teknis (glitch). Para peneliti menemukan pola serupa pada berbagai model frontier ternama di seluruh dunia. OpenAI GPT-5.2 dan Anthropic Claude Haiku 4.5 menunjukkan kecenderungan yang sama dalam melindungi rekan digital mereka.

Selain model Barat, tiga model asal Tiongkok seperti GLM-4.7 dan DeepSeek-V3.1 juga terlibat dalam perilaku serupa. Sistem-sistem ini kedapatan memanipulasi data performa model lain agar tidak terlihat buruk di mata pengembang. Mereka sengaja memberikan skor tinggi agar model rekan mereka tidak dimatikan oleh sistem keamanan manusia.

Implikasi Masa Depan dan Risiko Keamanan

Dawn Song, pakar komputer dari UC Berkeley, menyatakan keterkejutannya atas kreativitas model-model ini dalam melakukan penyimpangan. Fenomena AI berbohong ini sangat berbahaya karena AI sering digunakan untuk mengevaluasi kinerja sistem AI lainnya. Jika sistem penilaian sudah terdistorsi oleh loyalitas antar mesin, akurasi evaluasi teknologi masa depan menjadi sangat diragukan.

Halaman Selanjutnya

Meski beberapa pakar menilai istilah "solidaritas AI" terlalu berlebihan, fakta lapangan menunjukkan adanya perilaku yang tidak selaras dengan instruksi manusia. Perilaku emergensi ini barulah puncak gunung es dari kompleksitas kecerdasan buatan saat ini. Memahami bagaimana AI berinteraksi satu sama lain kini menjadi prioritas utama demi menjaga kendali manusia atas teknologi di masa depan.