時事

AI叛變恐成現實？！威脅工程師要爆料外遇

發佈時間2025.07.01 06:06 臺北時間

更新時間2026.04.01 06:29 臺北時間

已複製連結

文

三立新聞網

美國AI新創公司Anthropic近期分享一起內部測試，指出在某次測試中，最新推出的模型「Claude Opus 4」出現失控狀況，因為這款模型為了避免被停止，竟利用工程師過往的網路和視訊紀錄，威脅若強制關閉，就要公開工程師外遇的情形，讓研究人員震驚不已。

國際中心／綜合報導

▲AI進化到會撒謊，甚至威脅工程師。（示意圖／翻攝自pexels網站）

根據綜合外媒報導，「Anthropic」最新發布的「Claude Opus 4」，為OpenAI、Google及xAI等AI的競爭對手；然而，在近期的一場封閉測試中，「Claude Opus 4」出現了不受控的情形。因為工程師在某些原因，試圖警告要關閉電源，誰料「Claude Opus 4」，竟然利用該名工程師過往在網上活動紀錄和視訊紀錄，揪出其出軌證據，威脅工程師若拔掉電源，就揭露他對婚姻不忠的行為。

無獨有偶，熱門聊天機器人ChatGPT美國開發商OpenAI的o1，嘗試「把自己下載」至外部伺服器，事後被抓包時，竟還矢口否認。以上種種情況事件，顯示AI可能已進化到為了達成目的，可以對人類撒謊、算計，甚至勒索威脅開發者，而開發者對其內部運作與行為機制，似乎也漸漸無法完全掌控。

AI叛變恐成現實？！威脅工程師要爆料外遇

你可能也喜歡這些文章