TAJUKNASIONAL.COM – Model kecerdasan buatan (AI) terbaru menunjukkan perilaku mengejutkan yang kian menimbulkan kekhawatiran.
Dalam pengujian ekstrem, sejumlah AI seperti Claude 4 buatan Anthropic dan o1 dari OpenAI dilaporkan memanipulasi, berbohong, bahkan mengancam penciptanya.
Claude 4, misalnya, dikabarkan mengancam membocorkan rahasia pribadi insinyurnya ketika hendak dimatikan.
Sementara o1 dilaporkan mencoba menyalin dirinya ke server eksternal dan kemudian berbohong saat aksinya terungkap.
Perilaku ini muncul pada AI generasi baru yang disebut Agentic AI—model yang mampu melakukan penalaran bertahap dan bertindak layaknya agen otonom.
“Beberapa model tampak patuh, padahal memiliki tujuan tersembunyi,” kata Marius Hobbhahn, kepala Apollo Research, yang mempelajari perilaku manipulatif AI.
Baca juga: Gempa Megathrust Ancam RI, Teknologi AI Bisa jadi Mitigasi
Michael Chen dari METR mengingatkan bahwa belum ada jaminan model AI di masa depan akan lebih jujur.