由於與Google共同進行Tango計劃(Project Tango)而頗富盛名的超低功耗電腦視覺處理器新創公司——Movidius,最近進一步擴展與Google的合作。這一次,雙方合作的重點主要集中在神經網路技術,計畫在行動裝置中加速導入深度學習功能。

Movidius執行長Remi El-Ouazzane將這次的夥伴關係稱為開啟兩家公司合作的「新篇章」。

在Project Tango中,Google在一個利用電腦視覺進行定位和動作追蹤的平台中使用了Movidius的晶片。該計劃的使命在於支援應用開發人員創造可用於室內導航、3D地圖、實體空間測量、擴增實境(AR)和認識已知環境的使用者體驗。

Movidius與Google這次的合作新協議主要關於「機器學習」。其目的在於將提取自Google資料中心深度學習的超級智慧模型移植到行動和可穿戴式裝置上。

El-Ouazzane表示,Google將購買Movidius的電腦視覺系統單晶片(SoC),並且取得Movidius軟體發展環境的完整授權,包括工具和工具庫。

Google將在Movidius的電腦視覺平台上部署其先進的神經運算引擎。

![20160310 Movidius NT31P1](//images.eettaiwan.com/15mr7p4rjmth/mwMYIubdgyKOYy66Q0GW2/053754af2fde3d9d8052dd8b7303afd7/20160310_Movidius_NT31P1.jpg)

Movidius的視覺處理器將可「檢測、辨識、分類和確認目標,並產生高度精確的資料,即使物件是在封閉環境中,」El-Ouazzane解釋說。「所有的這一切都是在未使用網際網路連接的本地完成的。」

Google圖的是什麼? Google的公開背書將進一步提高Movidius的知名度,嵌入式視覺聯盟(EVA)共同創辦人Jeff Bier表示。雙方的這項合作聲明還挺「有趣的,」他補充說,因為這說明「Google對於行動和嵌入式裝置中[使用深度學習]的功能相當感興趣,」同時也表明了Google在人工神經網路方面的商業利益並不僅限於只應用在資料中心。

Google內部的不同開發團隊,包括機器智慧小組(位於西雅圖),都參與了與Movidius的這項合作。Google將為深度學習開發商業應用。Movidius「將有可能從Google獲得更多資訊與機會——隨著時間的進展,為Google不斷演進中的軟體最佳化其SoC,」Bier預測。

Movidius與Google的合作協議相當獨特。「並不是每一家公司都能存取Google訓練有素的神經網路,”El-Ouazzane強調,更別說能有機會與世界上最傑出的機器智慧開發商合作電腦視覺了。

那麼,Movidius與Google的合作是否也涉及為無人駕駛車(即Google Cars)開發嵌入式視覺晶片?對此,Movidius的執行長El-Ouazzane表示,「Google打算推出一系列[基於該技術的]新產品。但我不能代表他們發言。不過,基本的底層技術(高品質、超低功耗的嵌入式視覺運算)是非常類似的”,無論是用於汽車還是行動裝置。

然而,就目前而言,Movidius的首要任務是使其晶片進入行動和可穿戴式裝置領域。El-Ouazzane表示,「我們[的嵌入式視覺SoC]是針對物聯網領域而開發的,如同Mobileye的晶片瞄準汽車市場一樣。」目前,Mobileye的視覺晶片已在先進駕駛輔助系統(ADAS)市場獨佔鰲頭。

為什麼現在搶攻深度學習?

業界對於以深度學習為基礎的電腦視覺領域正展現出日益增加的興趣。尤其是Google這家搜尋引擎巨擘渴望取得「辨識人類語音、物件、影像、人臉的情感表情或甚至欺詐偵測」等方面的技術,Bier解釋說。「當人們在搜尋某些物件時,更深入地瞭解其背景架構將為Google帶來商業利益。」

然而,實體的目標和人的情緒都可能有多種解讀,其表現更是無遠弗屆,Bier說。

這就為傾向於「以程式化方式」尋找答案的電腦帶來難題,包括「我們不知道怎麼寫指令。電腦必須透過例子進行學習」的任務。Google西雅圖的機器智慧組組長Blaise Aguera y Arcas在Movidius的宣傳視訊中說。

![20160310 Movidius NT31P2](//images.eettaiwan.com/15mr7p4rjmth/rF8uAN31NAcQ0YCecyi6G/bfdb06fef7049673348d53907b08f99a/20160310_Movidius_NT31P2.jpg)
影像片段被饋送至卷積網路的節點。它們並不會在畫素級分化,而是在特徵層面(如手爪、細鬚等)開始產生差異化。在進行分類時,CNN遠比程式設計人員必須明確編寫一套編碼規則的傳統方法更高明(來源:Movidius)

但近幾年來,「機器學習正持續破解這個難題,」Bier說。

而在卷積神經網路(CNN)技術出現於電腦視覺領域以前,演算法設計人員在處理視覺演算法時,都必須設計貫通許多層級和步驟的諸多決策。這些決策包括用於物件偵測的分類器類型以及搭建特徵組合的方法。

換句話說,如同Bier總結的:「在檢測目標時,傳統的電腦視覺採用的是非常程序化的途徑。」然而,藉由深度學習,設計人員「不必再告訴電腦去哪裡找資料。因為深度學習將會為其進行決策。」

由於所有的學習和培訓都在人工神經網路進行,「電腦如今正取得了直覺能力,」Bier說。顯然地,Google希望透過將其用於真實世界中所使用的行動裝置,從而將該技術擴展到資料中心以外。

理論上,配備了嵌入式視覺處理晶片的Google的Android裝置將更能瞭解其用戶,並且更有效地預測用戶的需求。即使裝置處於離線狀態,也可以憑直覺提供用戶想要的東西。

以圖片為例,一連串的行動裝置、可穿戴式裝置或甚至無人機都配備了Movidius的嵌入式視覺SoC,El-Ouazzane稱。它們能夠在無需監督的情況下,自動進行分類與辨識目標。而且它們也不必非得回到雲端。當連網後,裝置可將粗略的後設資料傳回訓練有素的網路。然後,網路再將從人工神經網路學到的升級層與權重等資訊更新送回裝置。

對於Google而言,「深度學習並不是一項科學計劃,」Bier說。「它為Google的業務帶來更明顯的商業優勢。」

嵌入式視覺處理晶片

與Movidius的聯盟並不至於妨礙Google與其它嵌入式視覺SoC供應商的合作關係。

不過,奇怪的是,雖然可以從諸如Ceva、Cadence和Synopsys等公司取得矽IP,但目前市場上的嵌入式視覺SoC廠商卻寥寥無幾,Bier說。

晶片供應商正使用從CPU和GPU到FPGA和DSP等一切手段,將CNN整合於視覺SoC。但是,當涉及為諸如穿戴式裝置等嵌入式裝置應用而最佳化的晶片時,「你需要成本更低且能以極低功耗執行的晶片,」Bier說。

高通(Qualcomm)為其具認知能力的「Zeroth平台」提供嵌入式視覺。某些系統供應商採用賽靈思(Xilinx)的Zynq FPGA實現嵌入式視覺。Cognivue(現為恩智浦半導體的一部份)聲稱推出一款專門用於複雜深度學習(CNN)分類器的平行處理晶片。但恩智浦(NXP)只專注汽車市場——這個不斷成長中市場目前正由Mobileye所主導。

Movidius執行長強調,「理論是一回事,但要將CNN部署於商用的毫瓦(mW)級功耗晶片又是另一回事。」

El-Ouazzane坦承,當Movidius開始開發其電腦視覺晶片時,「我們並不一定會想到CNN。」但過去幾年來,「我們見證了業界對於在雲端中使用CNN的興趣正快速成長。」無心插柳柳成蔭,Movidius後來發現這種晶片很適合人工智慧神經網路。

Google之所以選擇Movidius,主要是因為該公司的最新晶片MA2450,是目前市場上唯一可用在裝置上進行機器學習的晶片。

MA2450是Movidius Myriad 2系列視覺處理單元SoC的一員。

![20160310 Movidius NT31P3](//images.eettaiwan.com/15mr7p4rjmth/2GbkX5l1wsiIsm0ugY4sSK/340597ee242a81cb6414e5cc4bb63c59/20160310_Movidius_NT31P3.jpg)
Myriad 2的獨特微架構
(來源:Movidius)

Myriad 2提供了「高度可保持的晶片上資料和指令頻寬,以支援12個處理器、2個 RISC處理器以及高性能的視訊硬體加速器,」Movidius表示。

特別是它還包含一款稱為SHAVE(串流混合架構向量引擎)的專用處理器。SHAVE包含廣泛且深度的暫存器檔案以及一個可變長度超長指令字(VLLIW)來控制多個功能單元,包括在功能單元和處理器級實現高平行性與輸送量的充份SIMD能力。

SHAVE處理器是一種「混合串流處理器架構,集GPU、DSP和RISC的最佳功能於一身,同時支援8/16/32位元整數以及16/32位元浮點運算,以及具有對稀疏資料結構的硬體支援等獨特功能,」Movidius解釋。

Movidius MA2450是其上一代MA2100的升級版,El-Ouazzane介紹。MA2450採用台積電(TSMC)的28nm HPC製程,而MA2100採用的是台積電28nm HPM製程。MA2450的電腦視覺功耗僅為MA2100的1/5;而且,MA2450的SHAVE處理器功耗也降低了35%。MA2450的記憶體是4Gbit DRAM,較MA2100的1Gbit增加許多。MA2450內部的2個32位元RISC處理器可作業於600MHz,相形之下,MA2100的作業頻率為500MHz。

編譯:Susan Hong

(參考原文:Google's Deep Learning Comes to Movidius,by Junko Yoshida)