該名官員說,像今年8月就有多家媒體收到一封名為「錄音檔!柯P揭賴副總統訪美內幕」的電子郵件,內容疑似民眾黨主席柯文哲在內部會議批評賴清德訪美的言論,引起軒然大波,因懷疑是利用深偽技術假造,最後柯請黨部直接向調查局台北市調處報案,也因此讓相關單位更加提高警覺、小心防範。
台灣明年初將進行總統、立委選舉,國安高層憂心AI深偽技術干擾選舉結果。這名國安官員解釋:「若有心人士利用深偽技術企圖影響選舉,例如剪接虛實交錯的畫面美化特定候選人,或刻意模仿手機偷拍畫面、製造候選人失言新聞等,甚至在投票當天或選前一天,利用捏造的爆料影片、發表造假的棄保宣言等,若無法在第一時間作出辨識或澄清,就可能影響大選的公正性,所以各單位才會如此繃緊神經積極應對!」
至於深度偽造(Deepfake)的來源為何?刑事局預防科長林書立向本刊表示,深度偽造一詞,取自深度學習(Deep learning)和偽造(Fake)2字,實務上是指利用AI人工智慧(Artificial Intelligence)結合電腦製作虛假影音,像之前台灣網紅小玉利用深偽技術販賣假名人不雅片就是實例。
網紅小玉利用深偽技術販賣名人情色片牟利,引起社會關注。(警方提供)他進一步指出,全世界第一個深偽技術,源於1961年IBM工程師製作的電腦語音合成系統,當時是先錄下人說話的聲音,再分類成語音片段,透過語音模式組合成完整的單字或句子,但仍容易聽出差異且成本偏高。
不過,自ChatGPT引爆生成式AI以來,不論是影片、文字、圖像、聲音類的AI技術都隨著加速進步,美國亞馬遜公司就曾在2022年發表一款智慧音箱,僅需錄製一段不到1分鐘的聲音,就能複製出說話者的聲紋語調,還在示範影片中代替一名已故的女性唸她生前未讀完的故事給孫子聽,只不過如此先進的深偽技術,卻也成為犯罪集團作案的工具。
最新的iPhone 15中也已發展出相關程式,能為使用者客製化深偽影音。美國《華爾街日報》就曾報導,英國一間公司職員接到假冒德國母公司執行長聲音的電話,匯出約新台幣757萬元的歐元,事後才懷疑是被AI所騙;加拿大一對七旬夫妻也因接到利用AI假冒兒子聲音的電話,跑了好幾家銀行將錢轉給詐騙集團。
林書立表示,深偽技術的進步已讓一般民眾無從辨識真偽,尤其是深偽音訊(Deepvoice)從過去AI需要一個半小時以上的聲紋學習,到現在視不同軟體的品質需求,僅需約1分半到3秒的聲紋就能做出不同的數位假聲音,或是合成足以令人混淆的目標人聲,費用僅需區區數十美元。
查察暴力賄選是法務部在選舉時的重點工作,如今防堵深偽訊息也成為主要目標。他說,許多知名網路公司都已經開始推出語音合成系統,程序是先合成一張照片再輸入文字,就可以主動播放數十國語言,甚至不同口音的新聞,這類服務目前也可透過月費或年費訂閱方式,提供文字轉成語音或是製作聲音模型的功能,值得注意的是,有的還主動提供用戶名人聲音作為噱頭,如特斯拉執行長馬斯克的聲音模型便名列其中,若再搭配深偽影片技術,根本就能以假亂真。
林書立提醒,深偽音訊目前在中國發展非常活躍,像是「騰訊智影」今年3月推出客製化服務項目,由於是全中文介面,極受中國用戶的歡迎,也應是當前詐欺集團主要運用的軟體,更透過提供「人、聲、影」3方面整合,使內容創作更簡單高效,花費150美元(約新台幣4,500元)就能做出客戶想要的影音檔,國內民眾對於相關應用程式,尤其是來自中國軟體的權限要求不可不防。
刑事局斥資千萬,從美國及荷蘭採購設備辨別深偽影音。本刊調查,為防堵深偽影音對大選可能的影響,最高檢察署已規劃選舉期間的全國性重大假訊息案件,由台北地檢署主任檢察官高一書、檢察官郭耿誠、江宇程3人專責偵辦,並協調相關機關或個人立即澄清,協助迅速下架並追查幕後主嫌,至於各地區性的個案假訊息則由各地檢察署負責,六都由轄區地檢署指派專責主任檢察官立即處理,並提出「AI生成或深度偽造影音、圖片、文字妨害選舉公正性案件研究」等報告,作為基層辦案的參考指引。
調查局長王俊力則表示,一旦該局接獲報案或發現類似不法,會儘速展開調查及檢測,調查官初步會先用幾種基本方式辨識深偽影片,包括購置商業平台偵測影片偽造機率,也可利用傳統影像分析方式檢測,肉眼識別也是重要的方法,除觀察生理特徵外,也可觀察臉部邊緣是否模糊或出現色差等。
國安官員直言若不預先做好準備,投票日當天如出現假訊息恐會不及澄清。王俊力強調,透過深偽技術製造假影片的手法,幕後可能涉及一群人的分工作業,調查局已做好準備,並早就採購多套軟體可辨識影片的真偽,準確度極高,絕對會傾全局之力依法究辦,積極達成「立即澄清」「迅速下架」及「追溯源頭」等3大目標。
網路是現今選戰重點,深偽影音的介入勢必會對選舉結果造成影響。(賴清德團隊提供)刑事局方面則是在今年初花費1,200萬元,分別從荷蘭及美國購入深偽影片和深偽音訊(Deepvoice)辨識軟體,本刊掌握,以這2家廠商的辨識軟體搭配檢測一段片長5分鐘的深偽影片,約可在30分鐘內就得知結果。
本刊掌握,1段5分鐘的深偽影片,刑事局的設備約30分鐘就能知道真假。(示意圖,刑事局提供)刑事局研發科長莊明雄告訴本刊,深偽影片技術因人類眼睛感官較靈敏,若仔細觀察,一般人仍可看出細微不同;深偽音訊技術雖未臻成熟,但因人類耳朵感官靈敏度較差,反而不易聽出變造痕跡,若2者結合,對一般人來說,根本就足以達到以假亂真的效果。
但深偽音訊發展日新月異,仍值得相關單位警惕,國際權威聲紋鑑定公司代表Geoffrey Han告訴本刊,深偽音訊再怎麼演化進步,透過基本聲紋頻譜分析、比對與鑑定,仍可協助釐清事實真相、還原事件真偽,基本檢測方式是將語音檔分成十多段,透過波形圖、平譜圖比對,播放時再利用開源軟體進行檢測,幾乎就沒有難以鑑定的狀況。
Geoffrey Han進一步指出,聲音工程專家還會注意編碼、解碼、串流、頻率等細節,一段深偽音檔至少有200個以上的工作參數可進行檢測比對;以台灣而言,如果台電願意提供各國電網頻率參數,聲音工程專家就可查出該音檔是由哪個國家的電網提供電力製作,甚至何時製作都可一清二楚。
有鑑於AI技術發展神速,間接加劇深偽技術的成長,歐盟執委會人工智慧高級專家小組已於2019年4月公布「具可信度之人工智慧倫理指引」,台灣「人工智慧基本法」草案也在2023年出爐,但面對明年初將屆的總統及立委大選恐仍緩不濟急,因此,國安會以降的各相關單位無不繃緊神經、整裝以待,嚴防境外勢力利用深偽技術影響國內政經情勢,也呼籲民眾明辨網路訊息,若有可疑除了謹記不看、不聽、不信、不傳等四原則,也可依法提出檢舉,一起杜絕不實訊息。