mirrormedia
時事

AI叛變恐成現實?!威脅工程師要爆料外遇

發佈時間2025.07.01 06:06 臺北時間

更新時間2026.04.01 06:29 臺北時間

美國AI新創公司Anthropic近期分享一起內部測試,指出在某次測試中,最新推出的模型「Claude Opus 4」出現失控狀況,因為這款模型為了避免被停止,竟利用工程師過往的網路和視訊紀錄,威脅若強制關閉,就要公開工程師外遇的情形,讓研究人員震驚不已。

國際中心/綜合報導

▲AI進化到會撒謊,甚至威脅工程師。(示意圖/翻攝自pexels網站)

美國AI新創公司Anthropic近期分享一起內部測試,指出在某次測試中,最新推出的模型「Claude Opus 4」出現失控狀況,因為這款模型為了避免被停止,竟利用工程師過往的網路和視訊紀錄,威脅若強制關閉,就要公開工程師外遇的情形,讓研究人員震驚不已。

根據綜合外媒報導,「Anthropic」最新發布的「Claude Opus 4」,為OpenAI、Google及xAI等AI的競爭對手;然而,在近期的一場封閉測試中,「Claude Opus 4」出現了不受控的情形。因為工程師在某些原因,試圖警告要關閉電源,誰料「Claude Opus 4」,竟然利用該名工程師過往在網上活動紀錄和視訊紀錄,揪出其出軌證據,威脅工程師若拔掉電源,就揭露他對婚姻不忠的行為。

無獨有偶,熱門聊天機器人ChatGPT美國開發商OpenAI的o1,嘗試「把自己下載」至外部伺服器,事後被抓包時,竟還矢口否認。以上種種情況事件,顯示AI可能已進化到為了達成目的,可以對人類撒謊、算計,甚至勒索威脅開發者,而開發者對其內部運作與行為機制,似乎也漸漸無法完全掌控。

更多三立新聞網報導
八仙塵爆滿10年!他被逼換假逃死劫…許明杰還原驚險經過
高雄女送便當給妹赫見已變「冰冷女屍」崩潰:昨天還好好的
新莊20歲男樓頂徘徊引不安…見警消趕抵「竟突墜樓」頭破慘死
竟非租金、人力問題…肥前屋無預警歇業原因曝:老闆年紀到了想退休

你可能也喜歡這些文章