這次是一家稱為ThinCI(發音為‘Think-Eye’)的公司,由一位出身英特爾背景的資深工程師/架構師Dinakar Munagala創辦。

然而,令人驚訝的是,這家位於美國加州的新創公司不僅有資本雄厚、擁有技術專精的大廠支援,而且還提供了一種獨特的「大規模平行架構」,Munagala稱其為「專為視覺處理和深度學習而生「。

Munagala承諾,相較於其它深度學習/視覺處理方案,該公司目前專利申請中的晶片架構可以帶來「兩個數量級的性能提升」。

從一座車庫開始,並以有限的資金熬過6年之後,ThinCI在上個月公開亮相。該公司最近還吸引了兩家大型一線汽車供應商成為其機構投資者,而且還有一批在技術領域聲譽顯赫的大廠成為其私人投資者。

這兩家汽車供應商分別是DENSO International America, Inc.,以及Magna International Inc.。私人投資者包括ThinCI董事會主席和Tallwood Venture Capital的管理合夥人Dado Banatao、英特爾架構部門前執行副總裁、總經理Dadi Perlmutter、巴斯夫(BASF)監事會主席和戴姆勒(Daimler)監事會成員Jurgen Hambrecht以及其他幾位背景雄厚的資深人士。

簡單、靈活

他們為什麼投資ThinCI?Perlmutter認為,「在整個職業生涯中,我非常欣賞簡單和靈活性。我並不喜歡一些蠻橫粗暴的方法,但著重於研究新運算問題的瓶頸,並且經由尋找新途徑發現克服瓶頸的方法。ThinCI就是這麼做的。」

當其它解決方案受限於資料的移入與移出,只為了填飽「饑餓」的巨大運算引擎時,Perlmutter形容ThinCI運算是一種「專為深度學習量身打造的繪圖分析法,省去了大量不必要的記憶體存取程序。」

而其最終的結果如何?「它不僅加快了運算速度,而且降低了成本和功耗,」他補充說。

Munagala說自己從六年前開始,就懷抱著開發一種新晶片架構,以滿足下一代技術(如深度學習)需求的夢想,因此毅然決然地離開英特爾。

然而,ThinCI並未透露其處理器架構細節,而僅稱其為「一種革命性的繪圖串流處理器」 (Graph Streaming Pocessor)。Munagala解釋,它是指「一種大規模的平行架構,專為同時處理任務圖形的多項運算節點而設計。」

深度學習本質上是以一組演算法為基礎,透過具有多個處理層、由線性與非線性交易組成的深度繪圖,嘗試在資料中建模高層級抽象。

ThinCI架構的獨特之處似乎就在於其處理深度繪圖的方式。

Munagala解釋,「ThinCI架構利用極端平行為整個繪圖任務串流資料,」取代以多個處理層透過深度繪圖連續處理資料的方式。

正如Perlmutter所說的, ThinCI處理器架構的另一個關鍵要素是可編程性「。他解釋說,許多人犯了針對特定方案進行硬體客製的錯誤,而歷史教訓是:問題是不斷變化的,而程式設計人員擁有巨大的創造力。Perlmutter表示,ThinCI需要的是一種「對處理器進行編程以實現可不斷發展新方案的方法。」

很顯然地,這正是ThinCI所提供的。Munagala指出,設計人員「在使用業界標準API的同時,也受益於獨特的編程方法。這使其簡化打造為其處理器最佳化的深度網路。

相較於市場上的其它處理器,Munagal以GPU為例指出,「儘管GPU已被用於深度學習(如Nvidia),但它並非為資料分析而設計的。它在視覺處理方面的效率不高,而且不僅功耗高、還需大量的記憶體。」DSP的問題則是編程的效率低且複雜。

那麼,硬線元件如何?也不可行!因為對固定方案來說,用於深度學習的演算法變化太快。 而CPU「僅適於通用目的」,因為它的效能不佳且功耗過高。

晶片上繪圖執行

相形之下,ThinCI的視覺運算引擎獨到之處在於它提供了「晶片上繪圖執行」(on-die graph execution)。它是專為加速卷積神經網路(CNN)、深層神經網路(DNN)和其它複雜演算法而設計的。更重要的是,該公司表示,來自攝影機感測器的資料「儲存和處理都在晶片上完成,而無需DRAM存取。」

20161103 ThinCI NT31P1 圖1:ThinCI的視覺運算引擎(VISCEN)硬體架構 來源:ThinCI

因此,Munagala認為,相較於其它的處理架構,ThinCI的視覺運算引擎可以帶來更高性能、更低功耗、可編程性以及更少記憶體佔用。

當然,視覺處理SoC市場已開始出現一些新的處理器。例如。最近被英特爾收購的Movidius就是一個很好的例子。它提供專為嵌入式市場設計的視覺處理器。

針對目前在深度學習中使用的架構,Munagala說:「就性能/體積、性能/功耗指標來說,ThinCI的解決方案更高出了13倍。」更重要的是,「就架構來說,我們的方案更具前瞻性,它能解決其它架構無法解決的問題。」他同時還強調「簡單編程模型」的重要性。

獲一線汽車供應商青睞

從兩家大型一線供應商投資ThinCI來看,清楚地反映了三件事:第一,汽車產業對視覺處理和深度學習技術的巨大需求(他們認為尚未看到全貌);其次,對於讓自動駕駛成為現實的堅定承諾;最後,一線廠商特別需要看到技術上的突破,讓他們有足夠的籌碼與新貴金主平起平坐地談判。

只需看看去年7月宣佈成立的Mobileye/Intel/BMW聯盟。很顯然地,一線供應商都缺席了。

「DENSO一直在研究電腦視覺處理領域的新發展,而我們對ThinCI的投資更展現了堅定信念,即ThinCI的技術將很快成為下一代自動駕駛系統的關鍵元件——未來的新系統需要先進的運算技術結合深度學習能力,」DENSO創投總監Tony Cannestra在一份聲明中說。

Magna技術長Swamy Kotagiri也表示:「我們很高興能結合ThinCI在處理和軟體領域的強項,以及Magna對於汽車系統的整體理解。

在汽車市場之外

ThinCI並不僅著眼於汽車市場。畢竟,汽車領域的進展一向十分緩慢,特別是考慮到在最終生產前必須進行的所有測試和認證。但這對在其它領域尋找近期機會的任何新創公司都意味深長。

Munagala解釋,視覺處理和深度學習應用「可以應用在任何地方」,從自然使用者介面到監控攝影機甚至白色家電。

Perlmutter同意這樣的看法。「汽車只是深度學習的一類應用,但深度學習卻可因應大量的新問題類型。

他解釋說,「創造適用於所有類似人類行為的適應性方案,包括從視覺、語音,一直到巨量資料收集的最佳化演算法,以及複雜的BOT與輔助等。

Perlmutter認為,深度學習成效卓著,特別是「當我們從智慧型手機轉移到增強實境(AR)類裝置時。」他說,「我們與AR裝置的互動,以及需要它提供的複雜程度(在辦公室、製造廠房和旅途中),將遠遠超越當今與智慧型手機互動的笨拙方式。」

值得慶幸的是,ThinCI在嵌入式市場的優勢在於其視覺運算引擎具有很高的可擴展性。 Munagala說:「我們能因應從可穿戴式裝置到內建通用軟體堆疊的伺服器等領域的多樣化市場。」

20161103 ThinCI NT31P2 圖2:新興應用需要新的視覺處理技術 來源:ThinCI

時間表

根據ThinCI,其視覺運算引擎架構「已在2015年告一段落,其測試晶片也已經完成驗證了。」該公司目前正籌措資金以實現計畫於2017年啟動的首次晶片生產。從今年初開始,ThinCI已經完成其軟體工具套件的beta測試。

ThinCI的投資者對於該團隊所提供的成果也信心滿滿。巴斯夫監事會主席和戴姆勒監事會成員Jurgen Hambrecht表示,由於「ThinCI擁有傑出的團隊和能力」,讓他決定了個人投資。

Hambrecht更看好的是,「ThinCI將為多樣化的產業應用帶來突破性的硬體軟體。」