AI晶片競爭紅海下的生存之道

作者 : 黃燁鋒,國際電子商情(ESMC)

在EE Times美國版今年發佈的Silicon 100榜單中,有大量席位被AI晶片公司所佔據。這兩年來,AI晶片公司可謂是投資界的大熱門,3~4年之後,這片紅海競爭的市場,又將變成怎樣一副模樣?

據市場分析機構GlobalData資料顯示,2021年第二季北美地區的AI風投總額就已經達到95億美元,相比上一季度成長了17.7%。這一季,AI晶片市場的大熱門除了SambaNova以外,還包括Anduril Industries、Groq、Scale AI、Easy Education。

AI投資熱的趨勢似乎並未停歇。GlobalData的季度預測資料顯示,想要加入這場喧囂派對的風投公司還在增加,甚至在TOP 5 AI晶片公司投資名單中,還見不到重複的投資者。中國AI晶片市場的情況也類似,在EE Times美國版最新的Silicon 100榜單中,與AI相關的中國企業有瀚博半導體、地平線、億智電子等。

 

圖1:去年3月美國AI晶片新創企業融資走勢,其中2020年僅統計了第一季(該表包含邏輯處理器,並未統計IP、儲存、感測、光電等市場)。

(來源:Semico Research)

 

比較有趣的是,Silicon 100報告的作者Peter Clarke曾表示,今年專注於GPU和AI的專用晶片新創公司數量與去年持平。「產業可能已經達到了『peak AI』的狀態。」 對此,《國際電子商情》(ESMC)分析師持保留態度,畢竟從投資角度來看,AI晶片熱潮還遠未結束。

本文重點探討AI晶片在雲端、資料中心、邊緣上的應用。市場對「邊緣」的定義存在爭議,本文將「邊緣」定義為雲端以外的部分,其中涵蓋了終端應用。

籠罩在Nvidia的陰影下

如果將以上內容作為背景,包括AI晶片市場的持續火熱、市場參與者數量增多、融資市場熱度並未消減。那麼對於資料中心大規模AI訓練而言,無法回避的一個話題就是Nvidia——該公司目前的營收表現,可反應出AI晶片市場有多火熱。

 

圖2:Nvidia 2011~2021財年收益與淨利潤走勢。

(來源:Nvidia年報,國際電子商情製表)

 

瘋漲的年度營收與利潤讓Nvidia不像一家老牌晶片公司。受疫情影響和全球缺芯的衝擊,Nvidia FY2020的業績表現出一定的頹勢,但Nvidia的業績在其他年份的漲勢令人咋舌(圖2)。從尚未結束的Nvidia FY2022來看,前兩個財季的表現依然「殺紅了眼」,FY2022 Q1/Q2的營收較去年同期分別成長了84%和68%,淨利潤成長了109%和282%。從上面的資料可以預判,Nvidia FY2022的年報又會相當好看。

Nvidia在資料中心AI市場的業務表現對AI晶片企業而言無異於「白色恐怖」。在超越Nvidia這件事情上,也遠不是給張PPT這麼簡單。要獲得在AI晶片市場上超越Nvidia的競爭優勢,除了到位的資金和優秀的團隊之外,至少還要滿足3個條件:晶片層面相比Nvidia有5~10倍的優勢;軟體上為開發者提供簡單的遷移路徑;有著保持領先的創新路線圖。雖然資料中心AI晶片的參與者在增加,但是同時具備這些條件的企業並不多。

Nvidia代表的是老牌晶片企業對AI市場的持續跟進。除了Nvidia以外,Intel、AMD等企業也在AI晶片市場動作頻繁。尤以Intel為代表,它已經全面涵蓋CPU、GPU、FPGA、AISC晶片類型。雖然Intel在AI晶片市場還是個新玩家,但是這類企業的資金優勢,讓其有能力進行大宗收購。前兩年,Intel分別以4億美元和20億美元的金額收購了Nervana和Habana Labs,代表這類老牌晶片企業在AI晶片市場仍可表現出活力。

除了老牌晶片企業持續發力之外,如今的市場參與者不得不面對資料中心AI晶片戰場第二大市場現狀。在日前的新思上海新辦公樓落成儀式上,新思科技運營長Sassine Ghazi告訴我們,如今晶片市場供需雙方角色發生了很大的變化。

在需求側,微軟、Google、亞馬遜、阿里巴巴、騰訊等企業成為尖端製程晶圓產品的買家,這些原本處於更下游的系統級企業,已經開始自己開發晶片。Google的TPU開創了這一趨勢的先河,為特定需求做針對性的晶片客製,是保持業務差異化和領先的重要組成部分。在這樣的大背景下,AI晶片市場參與者又是怎麼發展?

市場競爭餘地與突破之道

早年資料中心AI市場尚未崛起,GPU主要用於繪圖運算之時,GPU也是個群雄割據的市場,該市場的熱鬧程度不亞於如今的AI晶片市場。隨著產業的發展和技術的進步,堅挺到最後的GPU企業寥寥。這也是許多產業的特點,發展至成熟期後,市場僅能容納2~3個參與者。雖然這一點對邊緣側AI應用場景多樣性未必適用,但對資料中心大規模AI運算的市場而言應當不會有錯——現在的熱鬧局面終究會結束。

不過,Graphcore資深副總裁兼中國區總經理盧濤在接受《國際電子商情》採訪時表示:「如果比較理性地分析,如今市場的整體格局可能並沒有大家看到的那麼『熱鬧』……現在的AI晶片公司大致可以分成7大類,第一類是在組建團隊,第二類是在宣講理念,第三類是有晶片,第四類是有了晶片給客戶送測,第五類是有落地,第六類是有很多場景落地,第七類則是真正能夠跟GPU分市佔的。」

「要做到第六類、第七類的水準並不容易。」今年前不久,Graphcore公佈其IPU產品參與MLPerf Benchmark的成績時,公司規模已與2年前不可同日而語了,甚至還有專門的團隊參與MLPerf Benchmark項目。

IPU這類更專用的AI晶片,在單純硬體層面的效率、性能,以及性能/擁有權總成本(Performance/TCO)方面要達成對GPU的絕對優勢是理所應當。像Graphcore這類企業打造AI晶片,並令其產品有銷路、在更多場景落地應用,更關鍵的是生態的打造。Nvidia這麼多年來真正在資料中心碾壓其他競爭對手的地方,就在於生態建設完善程度要遠遠領先於其他市場參與者,包括對各行各業的應用覆蓋與落地,對各類工具、軟體庫的持續投入和最佳化。

但AI晶片生態又有獨特性,Linley Group首席分析師Linley Gwennap表示,相比PC、智慧手機晶片這種由寡頭領銜且難以撼動的市場,AI晶片市場有很大不同,「AI市場上,Nvidia的CUDA有著相當重要的地位,但AI模型普遍是用TensorFlow或PyTorch等來做開發——它們很容易跑在不同的硬體架構上。」

盧濤也在談話中表達了類似的觀點:「如今有TensorFlow的社群、PyTorch的社群、PaddlePaddle的社群等。阿里、微軟等廠商也在積極佈局其AI相關的軟硬體生態,這對體量相對沒那麼大的公司而言,其實是建立了重要的管道。」

「如今我們和這些社群進行配合,一方面讓我們少走了很多『彎路』;第二是透過開源社群,借助這樣的生態,我們能夠實現指數級的擴展——這些生態有牽引的作用。」盧濤說,「我們做生態的核心仍然是開源,然後借助社群。」

與此同時,盧濤也透露了Graphcore在生態構建過程中的另一個重要動作:「即使借助開源社群,可能還是會存在覆蓋率的問題。所以獨立軟體服務商(ISV)也將成為未來我們的重點發力方向。ISV也是生態中很大的一個板塊。」

雖然IPU目前落地的應用規模與GPU還有一定差距,但Graphcore現下聚焦於5大賽道,分別是網際網路、金融、研究、醫療健康(Healthcare)和其他(AI First),其落地速度相比AI晶片市場的其他競爭對手還是跑在前列。

暫避鋒芒走推理之路

對Graphcore IPU的第一印象是和GPU正面硬幹,不過IPU在資料中心是同時適用於訓練和推理的晶片。「如果一款產品既能夠做訓練,又能夠做推理,那麼它在生態方面就會有先天的優勢。」盧濤說,「因為使用其訓練出來的模型最後在其自身的平台上運作。」但實際上做大規模訓練的AI晶片並不容易,畢竟GPU仍然是最主要的市場玩家。

對於IPU這類兩者同時在做的晶片而言,「訓練和推理各有各的難點。」盧濤說,「訓練的一大難點是通用性。客戶購買一個訓練處理器可能需要處理各種不同的業務;而推理的應用業務鏈條會更長。AI演算法模型其實只是整個應用業務鏈條的一部分,推理的難點在於如何做到全鏈條打通。在一些比較大的企業中,一個鏈條內的不同環節甚至可能是不同部門在做,打通也會比較困難。」

「不過,推理和訓練比起來,用戶可能更願意為某一功能買單。」避開鋒芒以推理為突破口來打造晶片,或許是個不錯的方案,這也是Silicon 100榜單上的中國廠商瀚博半導體的思路。在今年的世界人工智慧大會(WAIC)上,瀚博發佈了SV100系列晶片和VA1通用推理加速卡,針對雲端通用AI推理。

瀚博半導體創始人兼CEO錢軍接受採訪時說:「瀚博SV系列是基於瀚博自主DSA架構的一款通用雲端AI推理晶片,設計宗旨是在推理效率遠超GPU的前提下兼顧通用性。」

此前,錢軍曾在發佈會上表示,瀚博確定從AI推理方面來突破,是因為「GPU在推理側並不是最好的架構」。隨著AI訓練逐漸走向成熟、AI應用慢慢落地,2021年推理市場的規模已經超過了訓練市場,未來兩個市場的差距還會越來越大。有機構預測,到2025年,90%的運算力都會用於推理,這也是瀚博看到的市場機遇。

邊緣市場呢?

之前,分析機構IDC表示,AI所需解決的問題多樣化,沒有一家公司、一種晶片類型、一類方法能夠做到最理想。IDC分析師解釋,AI用例過於多樣化,因此IDC在統計中追蹤了伺服器之上的17種不同工作負載。這些類型還可細分成更多的場景,每一種都場景都能用不同的硬體解決方案來實現效率的最佳化。

考慮晶片產業發展的實際情況,晶片設計與製造的規模化需求,令其很難真正做到一個場景用一種特定的晶片架構。這種場景的多樣化在邊緣乃至終端市場,卻又是另一番景象。以前,大部分AI推理任務主要在雲端進行,但隱私、延遲方面的要求將推理操作部分下放到了邊緣,包括雲的邊緣、邊緣資料中心、邊緣的終端設備(如手機、智慧音箱、汽車)。推理的去中心化趨勢,造就了巨量的市場機遇,也開啟了大量的利基市場。市場上大量的AI晶片新創公司都集中在邊緣推理部分。

邊緣AI晶片市場的火熱已無需贅言。Tractica去年的預測資料提到,到2025年,邊緣AI晶片的市場規模會比雲端AI晶片市場高出3.5倍(Tractica對「邊緣」一詞的界定,可能窄化到了終端裝置)。錢軍也認為,AI晶片的競爭紅海「更多的是在終端」。

WAIC圓桌論壇階段,愛芯科技董事長暨CEO仇肖莘說:「邊緣側應用是多樣化的,細分會出現更多的小公司。」終端推理晶片的規模比雲端的訓練/推理晶片更小,前者對晶片尺寸和功耗更為敏感。對AI晶片新創企業而言,現階段在終端市場的發力自然會避開鋒芒,未來一段時間內該領域會百花齊放。

去年,《國際電子商情》採訪瑞薩電子(Renesas)集團執行副總裁兼物聯網及基礎設施事業本部本部長Sailesh Chittipeddi時,他曾呈現過瑞薩DRP技術在邊緣AI推理方面,相比Nvidia、Intel的競品在效率上的領先優勢。

瑞薩電子中國物聯網及基礎設施事業本部企業基礎設施事業部經理葉永健大致介紹了DRP技術的發展。目前的第三代DRP技術,也就是DRP-AI,「擴展了AI-MAC技術」。其實際應用包括「物體檢測和數量統計方案」、「對AI深度學習模型進行加速運算,能實現對視訊畫面中指定目標進行靜態統計,同時也可實現對物體進出畫面的數量做動態統計。」

「邊緣AI一定是趨勢。工業應用要求即時、低延遲和高可靠性。邊緣AI避免了向雲端傳輸大量資料,具有減少延遲時間的優點。」葉永健說,「DRP-AI還可以減少AI推理過程中產生的熱量,從而提高可靠性。適用於工廠24小時不間斷運作。」

除了CV以外,AI實際應用的另一個重要方向是語音辨識和自然語言處理(NLP)。在邊緣AI推理晶片方面,中國的深聰智慧是一家將語音演算法與AI晶片進行軟硬一體化結合的語音AI晶片企業。

上海深聰半導體(以下稱為深聰智慧)董事長周偉達談到深聰智慧AI晶片的特點,包括「結合語音檢測和語音喚醒的硬體層分級低功耗技術;基於DSP擴展指令集的麥克風陣列訊號處理技術;基於NPU的深度學習神經網路加速技術」。其AI語音交互演算法是「場景化」的,針對不同場景(如環境噪音、語音和語言習慣)進行深度最佳化;而AI晶片本身是「針對本地演算法的需求進行特定的設計和最佳化」,包括神經網路結構等。

周偉達還解釋了以深聰為代表的智慧語音AI晶片,與CV方向AI晶片的不同之處:「語音辨識和NLP深度學習,以音訊和文本序列處理為主,更多採用迴圈網路和全連接網路,卷積運算相對較少。」而CV深度學習技術,影像「單影格資料量大,大量採用卷積運算,運算量大,但權值相對較少。」所以這兩類晶片並不通用——從中多少可以發現不同應用方向的AI晶片在架構上,要取得更高的效率,根據場景定義更專用的架構和最佳化還是必不可少的。

紅海競爭下的市場未來

本文開頭,Peter Clarke提及的「peak AI」:如今這片AI晶片競爭的紅海,AI晶片市場未來是否可能遭遇超載、熱度是否會緩慢消退?現在討論這個話題可能為時過早,不過Gwennap在今年上半年針對資料中心AI晶片市場曾說:「市場最終都會發生投資過熱或價值過高的問題,但我不確定我們是否已經發展到了這一步,即便我們正在向這個方向發展。」

有關資料中心AI晶片市場,當下可以觀察到的是Graphcore這家公司的規模顯著擴大,盧濤表示過去一段時間的人員成長「主要在軟體團隊上」。當年GPU還主要作為繪圖運算晶片存在,在步入成熟期之時,就是軟體工程師團隊的大量增加,這也是造成GPU後期形成寡佔市場的關鍵:在規模化擴大、生態形成競爭差距的時局之下,更多的市場參與者已沒有生存空間。雖然Graphcore的發展還沒到這一步,但這已經是個訊號。

在邊緣AI晶片市場,仇肖提及,「國外晶片公司,小公司很少,因為不斷有並購整合的情況發生。晶片產業需規模化才有利潤,才能做先進技術。只有規模化才有成本優勢,才能繼續拓展認知邊界,並且有更多的財務儲備。從其他國家晶片產業的發展歷程來看,未來走向整合的趨勢已經被驗證過。」

錢軍總結,「隨著機器學習的誕生,算力的需求和供給之間的差距越來越大,這給大量的新創企業提供了施展的舞台。任何科技進步都伴隨著資本的推助,直到產生大量的泡沫,這是一個大浪淘沙的過程。這個過程中會有許多新創企業不復存在。」

「大浪淘沙沉者為金,風捲殘雲勝者為王。」錢軍說,「AI運算力是無盡的,市場對運算力的需求也是無盡的。我們認為,科技進步的過程是長久,也令人振奮,會為我們這些積極奮鬥的人提供源源不斷的機會。」

某一類AI晶片企業自然無法代表市場全域,但AI晶片市場仍處在百花齊放階段,最終能脫穎而出並走到最後的,必然是有真材實料的市場玩家。3~4年之後,這片紅海競爭的市場,又將變成怎樣一副模樣?

本文原刊登於ESMC網站

 

 

 

加入我們官方帳號LINE@,最新消息一手掌握!

發表評論