2019.01.06 06:45 臺北時間

【視障者AI(上)】無障礙人工智慧成顯學 各科技巨頭搶破頭

圖|微軟技術負責人(Tech Lead)Saqib Shaikh(來源:微軟)
圖|微軟技術負責人(Tech Lead)Saqib Shaikh(來源:微軟)
從自動駕駛、無人機,到監控安防,視覺AI技術的突破為人們生活帶來了巨大改變,在許多領域迎來爆發式發展,僅在國內就湧現商湯、雲從、曠視和依圖等四大視覺AI獨角獸。但若真要論能為使用者帶來多大改變,恐怕很少有比得上這一項,那就是用視覺AI來打造盲人的眼睛。

無障礙人工智慧成顯學,各大科技巨頭亦相繼致力投入

AI for Accessibility、無障礙人工智慧近來已在國際間成為一項顯學。如何將發展迅速的人工智慧技術,用來改善全世界約10億殘疾人士的生活,也是各大科技巨頭致力投入的方向之一。
以視障者來說,近日Instagram就新增一項協助工具,用AI動辨識照片內容並以語音告知使用者。臉書Messenger也有無障礙機器人(Accessibility Bot),協助盲人辨識臉書朋友,甚至是朋友的臉部表情。華為Mate 20 Pro 也有一個應用程式Facing Emotions,可以將七種最普遍的情緒轉化為相應的聲音,可以大幅提升盲人與其他人的即時互動交流。
影像視覺AI並不是新的概念,其背後技術主要包含機器學習、深度學習,再加上3D臉部辨識等。尤其是深度學習演算法運用在訓練AI來協助盲人辨識物體,可以發揮非常大的用處。
比方說,如果我們想要設計一個AI協助盲人分辨不同面額的紙鈔。做法就是將一張10元紙鈔,通過各種不同角度,包含正面、反面、整張、邊角、其中每一小片圖案,都展示給AI看,讓它學習什麼是一張10元紙鈔。通過大量反覆學習後,視障者只要能讓手機鏡頭看到10元紙鈔的一小角,AI就能將它分辨出來。
「這些小事,會讓你很確實地感覺到自己的獨立性。希望隨著人工智慧的進展,可以讓我們更容易感受環境,協助我們完成更多日常事務」,微軟視覺輔助應用程式Seeing AI的專案主管、同時自身也是視障者的Saqib Shaikh,近日接受專訪時這樣對DT君說。
Saqib Shaikh在7歲時失去視力,此前不久,他才剛剛得到人生中的第一台電腦。
所幸這並不是他與電腦科學之間的句點。
而後他就讀視障學生小學,一位老師看出了他的潛力,鼓勵他開始學習打字。此後他一路進入大學,主修電腦科學,以班上頂尖的成績畢業,並取得人工智慧碩士學位。而後,他又加入微軟的人工智慧團隊,並在大約3年前通過微軟內部的駭客松競賽,以Seeing AI這個項目脫穎而出,獲得資源將之打造為實際產品,現在已可在美國地區免費下載。

Seeing AI用視覺AI說明 視障者「聽懂」世界

Seeing AI這個是一款結合圖像辨識、語音說明及人性化使用介面的應用程式,可以用手機上的攝像頭識別所有圖像,包含通過掃描條碼來識別產品、辨識身旁其他人的年齡,性別和面部表情,還可以描述它在圖片中看到的內容,並閱讀出功能表和檔。
同時,這款應用程式也可以結合智慧眼鏡,更好地協助用戶瞭解所處的周遭環境。
圖|Seeing AI是一款結合圖像辨識、語音說明及人性化使用介面的應用程式(來源:微軟)
Saqib Shaikh指出,近年深度學習技術的成熟,是Seeing AI可以真正發揮用處的主要關鍵。通過深度學習訓練,向系統展示大量照片,並教導它們照片中的內容,AI可以真正有效辨識出現實生活環境中的各種物體與人物。
本文係由DeepTech深科技授權刊登。原文連結:用 AI 帮助视障者“听懂”世界,专访微软传奇盲人工程师 Saqib Shaikh
更新時間|2023.09.12 20:28 臺北時間

支持鏡週刊

小心意大意義
小額贊助鏡週刊!

每月 $79 元全站看到飽
暢享無廣告閱讀體驗

延伸閱讀

更多內容,歡迎 鏡週刊紙本雜誌鏡週刊數位訂閱了解內容授權資訊

月費、年費會員免費線上閱讀動態雜誌

線上閱讀

更多內容,歡迎 鏡週刊紙本雜誌鏡週刊數位訂閱了解內容授權資訊

月費、年費會員免費線上閱讀動態雜誌

線上閱讀