每年我們都會在國際消費(fèi)電子展(CES)上看到一些令人驚嘆的技術(shù),包括汽車、智能機(jī)器人、無人機(jī)、增強(qiáng)現(xiàn)實(shí)/虛擬現(xiàn)實(shí)(AR/VR)、智能家電領(lǐng)域的創(chuàng)新和許多其他技術(shù)。從昂貴的未來派玩具演進(jìn)到實(shí)際有用的裝置是令人激動的,今年在這一方向上取得了重大進(jìn)展,當(dāng)然還是有一些言過其實(shí),只是作秀的小玩意兒。本文將探討哪些采用人工智能(AI)和計算機(jī)視覺的消費(fèi)裝置將會成為主流。
以攝影機(jī)為眼+內(nèi)建AI智慧
自2014亞馬遜(Amazon)首次推出Echo以來,語音接口已經(jīng)在過去幾年內(nèi)被廣泛采用。今年很明確的一點(diǎn)是,為了達(dá)到更高的水平,必須在邊緣裝置(edge device)采用視覺和人工智能技術(shù)。今年的CES展會上有不計其數(shù)包含攝影機(jī)的機(jī)器人,其中還有一些特別突出的產(chǎn)品。
Omron Forpheus采用AI技術(shù)打乒乓球
機(jī)器人公司歐姆龍(Omron)通過生動有趣的方式展示其技術(shù)——這是一款名叫Forpheus的機(jī)器人乒乓球大師。該機(jī)器人使用兩個攝影機(jī)來追蹤球的位置和速度,采用專利的預(yù)測模型計算球的運(yùn)動軌跡,以保持與人類對手的來回對抗。還有一個額外的攝影機(jī)追蹤人類玩家的臉部表情,判斷他們是否享受這一游戲過程,以確保這是一場有趣的比賽。雖然這并不意味著它是一個商用產(chǎn)品,但是表明人工智能、感測和先進(jìn)的機(jī)器人技術(shù)可以應(yīng)用于各種工業(yè)和消費(fèi)功能上。
并不是所有的展示都像Forpheus的乒乓球技術(shù)一樣流暢。LG發(fā)布的智能家庭機(jī)器人CLOi,就出現(xiàn)了一些尷尬的時刻,例如機(jī)器人沒有響應(yīng)語音指令等。擁有類似外觀的Jibo展現(xiàn)其社交技能,包括臉部辨識。該裝置自去年10月開始銷售,它采用一種與主流智慧音箱不同的途徑,使其更定位于社交,并能與用戶進(jìn)行個性化的互動。SLAMtec也展示一些機(jī)器人,其特點(diǎn)是Slam定位和導(dǎo)航解決方案,例如其中的通用的機(jī)器人平臺——宙斯(Zeus)。UbTech Robotics公司去年發(fā)布了Alexa驅(qū)動的人形機(jī)器人Lynx,今年則推出了可以爬樓梯和踢足球的兩足機(jī)器人。
從左到右依序是SLAMtec、 Jibo和視覺機(jī)器人Lynx(來源:CEVA)
Sony在90年代末推出的機(jī)器人寵物狗Aibo,最近正以全新且更先進(jìn)的版本重回人們的視線。它包含兩個攝影機(jī)和多個傳感器,從而可以辨識主人并且對觸摸和聲音做出反應(yīng)。
另一個和寵物相關(guān)的創(chuàng)新產(chǎn)品是交互式Wi-Fi寵物相機(jī)Petcube,它可以讓用戶遠(yuǎn)程檢查寵物的狀況。其中一款型號的寵物相機(jī)甚至可以讓你晃一晃手指就能為寵物準(zhǔn)備好一頓飯。
虛擬現(xiàn)實(shí)何時起飛?
至于虛擬現(xiàn)實(shí)市場的創(chuàng)新,我們看到了穩(wěn)步地成長,但仍未像預(yù)期一樣爆發(fā)。這主要是由于存在一些困難的挑戰(zhàn),例如有限的運(yùn)算資源、功耗、自內(nèi)向外追蹤(inside-out tracking)和內(nèi)容質(zhì)量的限制。
在CES 2018上,宏達(dá)國際電子(HTC)發(fā)布了HTC Vive Pro,支持高分辨率和低延遲,但更重要的是它能夠直接將內(nèi)容串流傳輸?shù)筋^戴式裝置上,而不必像其他裝置一樣需要使用電纜。相較于HTC Vive,Vive Pro看起來更大,而且由于價格昂貴,所以主要針對高階專業(yè)用戶。
無線的頭戴式顯示設(shè)備(HMD)——HTC Vive Pro(來源:HTC)
虛擬現(xiàn)實(shí)技術(shù)的新應(yīng)用之一是Google VR180,可望成為主流消費(fèi)產(chǎn)品。它采用創(chuàng)新的方式利用雙目立體相機(jī)技術(shù)擷取3D影像。并以180度的拍攝角度,取代不方便通過正常視角觀看的360度。致力于拍攝這種新格式的兩款產(chǎn)品是聯(lián)想(Lenovo)的Mirage相機(jī),以及小蟻(Yi) Horizon VR180相機(jī)。用戶可以透過Google Daydream VR頭戴式顯示設(shè)備(HMD)觀看3D照片,或是在任何屏幕上觀看2D照片。
無人駕駛車大出風(fēng)頭
無人駕駛車已經(jīng)成為過去幾屆CES大會上最具吸引力的展示之一。今年,汽車專家認(rèn)為無人駕駛車已經(jīng)是既定現(xiàn)實(shí),轉(zhuǎn)而開始尋找必要的服務(wù)和應(yīng)用,以滿足人類無需開車時產(chǎn)生的新需求。例如,福特(Ford Motor)執(zhí)行長Jim Hackett在主題演講中將整個自動駕駛車驅(qū)動的生態(tài)系統(tǒng)稱為“生活街”(the living street)。豐田(Toyota Motor)的e-Palette概念車也傳遞了類似的訊息,描繪車輛在沒有駕駛?cè)说那闆r下,擁有從行動賭場和餐廳到共乘服務(wù)和貨物運(yùn)輸?shù)亩嘤猛竞湍K化配置。
在自主航空領(lǐng)域,貝爾直升機(jī)(Bell Helicopter)公司展示如何在類似出租車的電動直升機(jī)中實(shí)現(xiàn)無人駕駛飛行的旅程。
這些例子證明每個人都清楚地認(rèn)識到無人駕駛車的革命正在發(fā)生。唯一的問題是一旦它實(shí)現(xiàn)了,我們的城市將會是什么樣子?
Bell空中出租車提供了自動駕駛直升機(jī)的縮影
智慧朝向邊緣發(fā)展
人工智能在過去幾年的爆發(fā)式發(fā)展,可說是因特網(wǎng)最直接的成果。過去,個人計算機(jī)(PC)和手持裝置還不夠強(qiáng)大到足以支持深度學(xué)習(xí),所以像是Google和亞馬遜等大型公司使用巨大的服務(wù)器中心在云端處理數(shù)據(jù)。這種方法的優(yōu)點(diǎn)是實(shí)現(xiàn)幾乎無窮盡的運(yùn)算能力,而不需要考慮哪一種特定裝置采用的處理器。但是缺點(diǎn)也有很多。首先是數(shù)據(jù)傳輸?shù)难舆t,會隨著網(wǎng)絡(luò)覆蓋狀況而發(fā)生變化,更不用提在沒有網(wǎng)絡(luò)覆蓋的情況了。更重要的是云端處理的缺點(diǎn)——隱私和安全的問題。因此,當(dāng)處理敏感信息時,最好保持在裝置上,而不是發(fā)送到安全性薄弱的外部。
這些理由清楚地表明使用云端處理深度學(xué)習(xí)只是一個臨時方案。一旦嵌入式平臺可以提供足夠的性能支持人工智能處理,就會開始在邊緣裝置上執(zhí)行。你可能想知道嵌入式平臺什么時候才夠強(qiáng)大能實(shí)現(xiàn)這一愿景,答案是它們已經(jīng)到位了。最新的旗艦級手機(jī),像iPhone X上的嵌入式神經(jīng)引擎能夠在本地辨識人臉來解鎖手機(jī),而無需再發(fā)送信息到云端。
其他還有許多的人工智能特性也可以在終端裝置上實(shí)現(xiàn),特別是透過強(qiáng)大和高效的數(shù)字信號處理器(DSP)以及基于向量處理器的專用深度學(xué)習(xí)引擎。先進(jìn)的處理和節(jié)能技術(shù)使這些系統(tǒng)比繪圖處理器(GPU)和其他用于遠(yuǎn)程服務(wù)器的處理器消耗更少的功耗,所以即使是小型、以電池驅(qū)動的裝置也可以使用人工智能處理器,而不必依賴云端。例如NeuPro人工智能系列處理器搭配軟件和硬件工具,能夠?qū)崿F(xiàn)嵌入式智能和更流暢的開發(fā)周期。
針對嵌入式裝置的自主專用人工智能處理器NeuPro(來源:CEVA)
本文來源:EE Times Taiwan,作者系CEVA成像與視覺DSP核心產(chǎn)品線總監(jiān)