從自動駕駛車輛、無人機、保全攝影機、醫療成像診斷工具,到工廠控制系統、檢測用機器人…所有這些具備視覺功能的嵌入式系統,現在都在認真看待機器學習技術,以做為產品差異化與大幅提升系統智慧的手段。

然而將電腦視覺與機器學習結合,對眾多系統設計者來說主要仍是理論性目標;人工智慧對許多工程師來說仍是個未能掌握的目標,設計機器學習推理引擎,需要非常專業的硬體知識。而且,並沒有為深度神經網路量身打造的一體適用推理引擎,能讓系統設計業者廣泛運用於各種不同的嵌入式系統。

為此可程式化邏輯元件供應商賽靈思(Xilinx)在3月中旬於德國紐倫堡舉行的年度Embedded World嵌入式技術大會期間正式發表名為reVision的堆疊(stack)技術;該公司企業策略部門資深副總裁Steve Glaser表示,該堆疊能讓缺乏硬體設計專長的軟體與系統工程師,更輕鬆而快速地開發智慧視覺導向系統。

Glaser表示,賽靈思從已經著手開發機器學習技術的客戶了解到,8位元以下的定點精度(fixed point precisio),是能大幅提升機器學習推理系統效率的關鍵:「為了達到最佳反應時間,我們需要確保客戶能透過推理與控制,建立從感測器的高效率資料流;」其客戶們面臨之其他任務,還包括支援最新神經網路、演算法與感測器的可重配置性(reconfigurability),還有對新舊機器、網路與雲端的各種連結。

20170317 Xilinx NT02P1


越來越多的視覺導向自動化系統 (圖片來源:賽靈思)

技術顧問機構Moor Insights & Strategy的高性能運算(HPC)繼深度學習資深分析師Karl Freund接受EE Times訪問時表示:「人工智慧仍在起步階段,而唯一不變的是會持續快速變化;」在這種情況下,賽靈思試圖為設計工程師減輕寫程式的負擔,在高度競爭的產業界以最快速度進行最佳解決方案的實驗與佈署,以加速推出應用。

賽靈思的機器學習推理系統設計方法,與CPU/GPU供應商如英特爾(Intel)、Nvidia的方案大相逕庭;市場研究機構The Linley Group資深分析師Loring Wirbel解釋,CPU/GPU供應商採用的傳統途徑,是從一個大型架構──例如Nvidia的Tesla P100以及英特爾的Knights Landing──著手,支援基於訓練之學習;然後採用單精度或半精度架構──如Nvidia P40或英特爾Knights Mill──修改系統,支援無人監督的學習。

Wirbel指出,總而言之,商用半導體元件供應商期望學術界能夠決定他們能應用於推力學習的最精確架構,但這仍是一個變動中的目標;而他認為,賽靈思提供的軟體堆疊有趣之處,在於它是建立於支援以雲端為基礎之無人監督推理的原始堆疊──Reconfigurable Acceleration Stack──之上,然後將推理能力擴展到網路邊緣與嵌入式應用。

「有人可能會說他們採取的是比產業其他方案落後的方法,但我的觀察是,機器學習產品開發商在訓練與推理子系統上正朝著多頭方向發展;」因此Wirbel認為在現階段:「沒有哪個方法是正確的或是錯誤的。」

Moor Insights & Strategy的Freund觀察,reVision為眾多視覺導向應用提供了可擴展與彈性的平台,特別是功率非常高,以及新需求可能需要可重配置性的應用。reVision堆疊的主要功能是平台、演算法與應用開發資源,並支援大多數熱門的神經網路,例如AlexNet、GoogLeNet、SqueezeNet等等;此外還提供程式庫元素,例如預定義的卷積神經網路(CNN)網路層實作。

在應用程式框架方面,賽靈思的reVision堆疊支援機器學習框架Caffe的演算法,以及OpenCV電腦視覺處理功能。The Linley Group 的Wirbel指出:「如果產業界沒有先存在如Caffe應用程式環境以及演算法開發工具,reVision也不會誕生;」他指出,reVision將於今年第三季添加OpenVX,會是一件大事。

20170317 Xilinx NT02P2


reVision堆疊支援的平台、應用程式與演算法開發資源 (圖片來源:賽靈思)

而在硬體平台方面…

 
繼續閱讀:當電腦視覺遇上AI…(下)

編譯:Judith Cheng