未來十年半導體業成長驅動力在「資料」

作者 : 顧正書,EE Times China

在《EE Times》出版集團ASPENCORE主辦、在中國深圳舉行的「2020年全球CEO峰會」上,被大家稱呼為「Wally」的半導體產業老將Walden C. Rhines與現場與線上聽眾分享了AI晶片和資料擷取/分析/保護的最新趨勢與技術發展動向...

從TI到Mentor,再到最近的Cornami,在被大家稱呼為「Wally」的半導體產業老將Walden C. Rhines長達50年的半導體職業生涯中,見證了IC的誕生、IDM廠商的生死起伏,以及EDA行業的「三國殺」。現在他又踏上了AI晶片和資料加密運算的創業旅程,希望透過完全同態加密(FHE)運算技術為大資料保護和處理市場帶來一場顛覆。

在《EE Times》出版集團ASPENCORE主辦、在中國深圳舉行的「2020年全球CEO峰會」上,Wally與現場與線上聽眾分享了AI晶片和資料擷取/分析/保護的最新趨勢與技術發展動向,介紹了一種新的加密運算技術及其市場前景,並對全球半導體未來10年的發展趨勢做出了獨到分析和預測。以下是他的演說重點。

半導體業的成長驅動力

從歷史上看,全球半導體產業的發展一直受到大規模新興應用的驅動,這些成長如上圖黃色「 S曲線」所表示,從大型機到小型機、再到個人電腦和筆記型電腦,然後再到行動通訊,每個應用都推動著半導體產業進入新一輪成長。 那麼,什麼應用將推動下一波半導體發展浪潮?「資料」將是主要驅動力。

圍繞資料這個核心,有四個領域的應用值得關注:人工智慧、機器學習、IoT邊緣運算與5G通訊。所有這些新興應用可以歸為「巨量資料(大數據)管理和分析」。無論是在AI中構建ML模型,還是在IoT中使資料分析更接近資料收集點,還是工廠自動化中即時通訊的處理,這一切都與管理和分析大數據有關。

資料就是資訊時代的新「石油」

 

 

如今,「數據就是新石油」的說法變得越來越明確。從數據中擷取資訊,透過學習、構思和創新就可以創造價值和財富。現今,每隔2~3年,可用於運算分析的資料量都會翻倍,而我們只能分析約2%的可用數據。

以噴射引擎為例,Pratt & Whitney、通用電氣(GM)和勞斯萊斯等引擎製造商都會持續監控所製造的發動機引擎性能,每個引擎每小時產生的資料量超過70TB。只有這些引擎的製造商才能使用這些數據來深入瞭解引擎的運作狀況和潛在的維護需求。

這些資訊對於航空公司至關重要,他們願意付費購買。引擎製造商甚至可以改變一下商業模式,引擎免費送,而只是向航空公司收取維護服務的費用。由此可以看出,擁有高價值的資訊可以成為一門大生意。

數據的收集及收益

 

視訊和影像會產生大量數據,每天超過1PB (百萬GB)。此外,IoT裝置中的感測器不斷收集各種類型的數據,包括視覺資訊、氣味、聲音和振動等。感測器正變得越來越複雜,為設計人員整合多種技術(包括類比、數位、RF、MEMS和其他電子元件)帶來了巨大挑戰。

 

 

像智慧手環等可穿戴設備,在很小的空間內整合了MCU、MESM感測器、加速度計、電池充電和管理晶片、ADC轉換器、類比信號處理,以及藍牙等RF無線通訊功能。設計極其複雜,但又要求低功耗和低成本,這為半導體廠商和IC設計工程師提出了極高的要求。

 

 

實際上,半導體廠商並不是資訊和數據收集熱潮的真正受益者。真正的受益者是那些擁有數據,並對其進行分析然後再出售資訊的公司,諸如Google、Facebook、阿里巴巴等網際網路業者,他們正致力於收集數據,透過分析和銷售資訊而獲得數十億甚至數百億美元的收入。

 

 

十年前,Fabless半導體業者購買了晶圓製造廠商80%的晶圓,三星(Samsung)、英特爾(Intel)和德州儀器(TI)等IDM購買了剩下的20%。如今,Google、Apple和華為等系統和資訊技術公司購買了接近20%的晶圓,這一細分市場每年都以35%的速度成長。

資料分析和VC投資

 

過去20年來,晶片業者獲得的VC投資在2000年達到頂峰,約為25億美元,在隨後的15年之間持續減少。然而,在2017年,特定領域處理器AI晶片新創公司獲得的VC投資迅速增加,在2018年達到35億美元的峰值,比2000年的最高記錄還增加了10億美元。VC投資的無晶圓廠半導體公司中有一半以上都是專注於AI領域。

 

 

如果僅分析2012年至2019年這7年間半導體公司的前三輪募資,我們會看到AI和ML佔據了大部分投資。這些AI和ML晶片的目標應用是什麼?

 

 

上圖顯示了這段期間內鎖定各種不同應用的新創公司數量。其中最大的類別是模式(pattern)識別。大部分投資挹注到視覺和臉部識別領域,也有大量資金投到其他模式的識別,例如語音辨識、氣味識別、疾病診斷和自動駕駛車輛控制等。

風險投資的第二大類別是高性能運算(HPC),特別是資料中心。Graphcore、Groq、Habana Labs和Cornami是「後Von Neuman」時代開發新的晶片架構的範例。

第三大類別是通用邊緣運算。許多分析人士認為,IoT將推動邊緣運算的快速成長,但速度卻低於預期。不可避免的是,它將是一個巨大的成長領域。為什麼?因為那是電腦產業發展的必然方式,即從集中的高性能運算到普及的邊緣甚至終端運算。

資料保護和FHE

有三種主要方法可以保護敏感性資料。 一種是將數據導入演算法並在資料中心進行處理。採用這種辦法,你必須信任資料中心及其電腦、作業系統和其他通訊設備。但是,資料中心可能遭到駭客攻擊,因此不能完全信任。

第二種方案是在構建機器學習模型時保持資料安全,其中之一稱為「聯合式學習」。利用聯合式學習,機器學習模型的子集被下載到敏感性資料的位置,例如手機、PC或本地資料中心。機器學習模型從數據中學習,然後發送回模型的創建者。這種方法也不是很安全,因為你必須信任模型所有者以及用於從數據中學習的所有演算法。

 

 

第三種方法是同態加密(Homomorphic encryption),就是讓資料始終處於加密狀態,任何人都不能信任。FHE可以保護資料,而不是資料中心。用戶端僅使用FHE加密資料,然後將其發送到雲端。無需解密即可對加密資料執行所有形式的算術和邏輯運算。 運算的加密結果被發送回用戶端,用戶端可以解密資訊。只有數據的所有者才能看到原始資料文本,所有其他人只能訪問加密的資料。

在不久的將來,可以使用加密資料構建機器學習模型。這對於個人財務和醫療數據尤為重要。 據IDC預測,到2024年軟體和服務的機器學習市場將達到200億美元規模。

一旦FHE被廣泛採用,擁有資料的任何人都可以透過建立專有模型來利用它。無需出售模型中的數據,只出售對模型的存取權限。資料可以成為所有應用類型的業務,數據中的資訊和獨到發現可以一次又一次地轉售給許多客戶。只有資料的所有者才能看到實際的資料。

既然FHE擁有如此不可思議的優勢,為什麼還不儘早採用?FHE有其自身的問題,它在運算上非常密集。如果以與未加密數據相同的速度處理FHE加密數據,就要求電腦的運行速度是當今典型的Intel Xeon或Nvidia伺服器的一百萬倍。

 

 

AWS曾經嘗試在傳統的Intel Xeon伺服器上實施FHE,處理具有1億條資料的典型財務資料庫,需要2萬4,000個核心的處理器進行4.4天的運算。而Cornami正在開發的晶片設計的模擬表明,透過使用特殊的編譯器和處理器的動態可重配置性,可以將4.4天壓縮為10秒。

為了有效執行FHE運算,我們需要能夠隨處理器核心數量擴展性能的電腦體系結構,這需要特殊的軟體編譯器和特殊的晶片架構。因應FHE處理的挑戰需要多種功能的結合:

  • 大規模平行運算;
  • 消除大多數記憶體讀寫;
  • 可以生成整合、獨立的可執行資料流程和控制流的軟體;
  • 能夠隨晶片、板卡和伺服器上的處理器核心數量線性擴展的晶片硬體;
  • 動態可重配置的硬體以因應不同的演算法,從而改變字寬或流水線深度。

這些功能已在FPGA模擬器進行實證,可用於測量晶片設計的性能。晶片的實際生產將在明年啟動。當第一批晶片於明年某個時候推出時,預計將很快採用即時FHE。例如美國國防部已將確定採用FHE解決方案,並正在宣導FHE軟體在國際上的可用性,以確保全球所有電腦數據的安全。

據Gartner估計,到2025年,全球所有公司中將有25%具有同態加密程式。基於HE和FHE的軟體和服務公司正在增加。所有這一切都「恰逢其時」,因為當今的網際網路安全機制可能會被1000量子位元的量子電腦輕易打破。FHE是當今唯一已知的「經得住量子攻擊」的安全方法。

 

 

最後,Wally總結,電子裝置和系統的半導體含量將繼續成長。經過20多年的發展,半導體含量相對穩定地保持在電子設備價值的16%,我們最近看到了這一含量比例的加速成長,現在大約佔據電子裝置價值的20%。

資料將成為新的石油。它承載了我們的專業知識、資訊和創新。過去十年中,資料的收集、分析和保護取得了巨大的進步。資料是未來10年半導體產業成長的驅動力。

 

本文原刊於EE Times China網站

 

 

 

加入我們官方帳號LINE@,最新消息一手掌握!

發表評論