大家可能不知道目前 AI 人工智慧大概分為兩種,一種就是像臉書 / Google線上語言翻譯,或是像依照語音命令幫你搜尋資訊的 Google 語音助理/SIRI這類的巨量雲端 AI 應用。還有一種就是行動裝置終端的 AI 應用,如臉部辨識、拍照場景辨識/優化…這類在本地端不需聯網的 AI 應用。上週的深圳 Qualcomm AI Open Day 研討會之後,主辦單位在會場旁邊也邀請了中國業內 AI 相關業者展出行動裝置端的 AI 應用,為大家做簡單的介紹。
過濾背景音與 AI 算力展示
首先來到高通自己的攤位,這裡展示的是 Snapdragon 855 與 710 處理器在第四代 AI Engine 底下使用 HVX(Hexagon 向量加速器)與HTA(Hexagon 張量加速器)協同運算之後算力的差異:
Snapdragon 處理器採用「異構多核心」的方式設計,在第四代 AI Engine 裡面又新增了 HVX 與 HTA 的設計,在兩顆處理器同時運作的情況下,算力會有蠻大幅度的提升(看不懂的朋友建議閱讀一下這一篇)。下圖左就是 HVX 與 HTA 協同運算,下圖右是關閉 HTA,只有 HVX 獨立處理,Snapdragon 855 平台大概會有一倍的差距:
在730平台則是差了1/3(S855算力還是強不少呀):
在使用語音輸入、語音命令時,最怕的就是背景因太吵雜,Qualcomm 的 AI 語音輔助技術可讓裝置在吵雜背景底下也能隨時背景接收語音指令喚醒並執行,主要應用在於 OK Google 與廠商的第三方語音助理(如小愛同學)上:
現場說明:
晶圓壞點檢查
一般人應該沒有在晶圓廠工作的經驗,雖然製程都是全自動的,但檢測每個單元是否有壞點幾乎都是靠人工目視檢查,而這個技術就是透過手機鏡頭與內建的 AI 應用檢查晶圓是否有壞點,大大減少從業人員的工作時間與眼力:
智慧看板應用
另外的智慧廣告看板系統,只要架設一台有攝影機的機器在會場,不需要電腦系統就會依照人臉識別路過的人群性別、年紀、心情與走動路線等資訊,在對應的位置顯示適合的廣告內容:
使用情境是展覽場、露天演唱會等大型活動:
收集的相關資訊也會整合到後台中進行統計:
無人商店
我個人覺得最有去的是由「華捷艾米」所推出的無人商店方案,與 AMAZON 的無人商店方案相比相對簡單與平價:
首先顧客要先下載App並進行臉部特徵與信用卡資訊登錄,完成的人就可在門口的臉部識別處進行檢驗,檢查通過才能進入:
華捷艾米的方案主要是使用 AI 視覺辨識的超商貨架:
在貨架上方與內部配置鏡頭,可識別哪個消費者拿了商品、又取走哪些東西。現場詢問工作人員如果說消費者偷竊、不買了將產品亂放沒歸位是否會受到影響,廠商則是信心滿滿的表示這些狀況都模擬過,只要有東西沒結帳超商就不會開門讓對方離開(保全也會同時出現):
系統會依照超商內的人群即時辨識哪些人怎麼走、又取走了哪些產品,後台也會有相關紀錄,至於準不準確就還要等上線實測:
王者榮耀 AI 電競戰隊
vivo、騰訊與高通合作打造的王者榮耀 AI 電競戰隊「SuperX」,在現場也初試啼聲亮相:
AI 人工智慧與真人玩家進行PK比賽,根據現場的簡報,vivo與騰訊的目標是要將這支戰隊與真人職業隊伍進行PK對戰:
AI戰隊的相關影音介紹:
TOF深度攝影機與動態捕捉系統
以往要在電視上玩「體感遊戲」通常都需要類似 KINET 之類的攝影機才能進行,現在使用 AI 與 TOF 鏡頭協同使用就可以直接偵測玩家的動作進行各種體感操作的遊戲:
使用的手機是搭載 TOF 深度鏡頭的 OPPO R17 Pro:
認真說如果可以發展成另一個獨立機器的話,也許這種玩法是有商機的:
超級解析度處理
另外覺得拍出來的照片不夠清晰嗎?也有廠商推出超級分辨率的 AI 應用,讓模糊的照片經過處理後變清晰:
AR 大頭貼運用
這間廠商最厲害的是可以即時依照你的個人形象產生一組AR大頭貼,並與本人的頭部進行無縫結合,辨識相當精準:
阿達的鳳梨頭也判別的不錯(變帥了):
還可以即時更換髮型、眼睛等各部位的造型:
也可以產生各種動作的AR造型大頭貼,主要厲害的是相似程度是目前我個人使用過最好的:
測試影片:
AR即時翻譯與學校作業解題
「有道科技」是中國相當知名的翻譯公司,「有道翻譯官」就是他們旗下的知名 APP,好用程度不輸給 Google翻譯(甚至更好):
以往的 AR 翻譯必須透過聯網才能使用,有道使用的 AI 神經網路翻譯系統,可在離線狀態下也翻譯出水準不錯的譯文:
另外這個功能就比較逆天了,有道開發出只要拍作業本上的題目,系統就會幫你解出答案共支援國小、國中、高中與九種學科(需聯網),千萬要注意別讓小孩使用呀(笑):
有道翻譯與解題的實際使用影片:
AI 即時錄影特效
中國軟體公司「曠視」推出一款「希區考克變焦」的 AI 影像處理應用,也就是所謂的「推軌變焦鏡頭」(Dolly Zoom)讓人物在原位置,維持相同大小,畫面背景卻有「Zoom In」的效果:
大概就是這樣的呈現方式,以往必須要有專業攝影師與器材才能做到,現在只要有手機,在本地端就能完成:
超級夜景與即時美體
最後是由「Arcsoft」(虹軟)所推出的特殊效果,包含了超級夜景效果與即時美體等 AI 功能:
超級夜景的效果相當驚人,除了降噪以外同時連細節也都完整呈現:
經過實際測試效果非常好,原則上在 Open AI Day 的所有廠商都是提供技術授權給手機製造廠商使用,所以以上的技術在許多手機廠的相機效果中都看的到,也大幅減少廠商開發時間:
即時美體效果,可支援在照片影片上,同時不會有變形的狀況:
整體來說人工智慧並不像以往電影中那麼狹隘,只要具備學習、分析、判斷能力的都可稱為是人工智慧的應用,以前我們覺得 AI 在雲端、在科幻電影中,但隨著科技的進步與如高通這類廠商的努力,AI早已經與我們身邊的手機、智慧喇叭、智慧穿戴…等各種應用結合,接下來