結合AI 「聽得懂」的MEMS麥克風展現新價值

作者 : Anne-Françoise Pelé,EE Times歐洲特派記者

語音辨識介面的未來應用將會更廣泛,其真正價值則會體現在高音質以及對麥克風周遭環境的感知上...

對話是一種自然的互動模式,也因此成為備受矚目的人機介面;語音個人助理(Voice-based personal assistants,VPA)應用越來越普及,進駐如智慧型手機、智慧揚聲器、智慧手錶、無線耳塞式耳機、汽車、智慧電視及其遙控器等裝置,甚至連垃圾桶也整合了語音辨識功能。其未來應用將會更廣泛,真正的價值則會體現在高音質以及對麥克風周遭環境的感知上。

而總部位於法國Lyon的市場研究機構Yole Développement認為,音訊會是人工智慧(AI)將要進軍的下一個細分市場。

AI如何找到自己的「聲音」?

VPA應用是如今音訊產業的主要驅動力,相關方案以傳統音訊系統零組件──包括音訊編碼器、麥克風、微型揚聲器以及音訊放大器──為基礎,同時利用AI來完成語音資料的運算與分析。運算能實現語音辨識、音源定位等複雜的音訊功能,在雲端平台或位於邊緣的消費性電子裝置中都可以執行;而分析則在雲端完成,因為需要較高處理能力並存取大量資料。

Yole的光子與感測部門技術暨市場分析師Dimitrios Damianos表示:「AI的附加價值在於對自然語言的處理能力,語音是與機器互動的更自然方式,不必使用鍵盤也無需動手,只要說出來即可;」但是,要實現這一點,機器得完成許多處理任務,才能理解使用者在說什麼、他們的語言及其含義。Dimitrios指出:「AI為解碼技術添加了更多的價值,幫助我們與電子裝置溝通。」

在被問到VPA何以迅速普及時,Damiianos將其歸因於其便利性和高效率;而當然:「如我們所見,像是Google、Apple、Facebook、Amazon和Microsoft等科技巨擘(簡稱GAFAM)都試圖推廣VPA應用,因為這樣才能讓他們所擁有的資料具有真正的價值。」

20200401_MEMSmicrophone_NT31P1

對使用者來說,音訊的接受度比影像更高,因為他們認為音訊「不那麼煩人,所以對主要業務就是與資料相關的GAFAM來說,音訊是個從使用者收集資料的好方法;」Yole的MEMS和感測器部門技術暨市場分析師Alexis Debray認為:「有些公司利用資料做生意,而有另一些公司的生意是與個人隱私相關、以其技術能確保使用者隱私權為賣點;」例如Apple就一直宣揚對個人隱私權的保護,並使之成為有利的行銷資本。

Damianos指出,對科技巨擘們來說,真正的價值在於從環境中提取盡可能多的資訊,這意味著VPA不只會聽使用者的聲音,也會聽他們周遭的聲音並瞭解其所處環境。舉例來說,「如果你在廚房,麥克風會因為聽到切菜聲就立即知道知道你要下廚,並推薦食譜;」這就是對話式AI。

對話式AI之後的下一步很可能是全面感知(Full Awareness),這個時候的虛擬助理──無論它是智慧音箱還是智慧手錶──可以像人類一樣與使用者溝通。Damianos指出,全面感知還只是概念性的,存在很多不確定性:「我們還無法預測時間表,也許它將在對話式AI之後5~6年才問世;這取決於AI本身以及該領域各家業者的進展。」

儘管那些「一直在聽」(always-listening)的系統若作為車用人機介面,可望因此挽救生命,但同時也引發了人們對使用者隱私保護的疑慮。為了防止可能的濫用,Debray強調,資料處理應該盡可能快速且靠近麥克風執行;「越靠近麥克風,隱私洩露的可能性就越小。」

隱私包括多個維度,使用者可能希望隱藏其性別、年齡或情緒;對此Debray表示,他相信未來麥克風、ASIC或應用處理器領域的各家業者會開發出能確保使用者隱私權的技術。例如麥克風可以消除聲音中的情緒元素,僅送出音訊資料。

而Yole分析師預期,GAFAM等大型業者將持續佔據市場主導地位,因為目前他們在資料分析方面扮演要角;但是感測器製造商顯然渴望將AI整合到邊緣,並將音訊分析業務從雲端分離出來。Damianos認為:「感測器製造商想要增加營收,並且在音訊市場上分到更多大餅;但他們並不想與巨鯨爭食,這是感測器業者之間的戰爭。」

Debray評論,感測器業者的確在追求多角化經營策略,「以試圖在價值鏈中更上一層樓,而且更一體化。」

MEMS麥克風業者Vesper Technologies執行長Matt Crowley在最近的一次採訪中表示,他們公司正在尋求提高其壓電MEMS麥克風的智慧性:「我們相信,未來我們會讓感測器搭配嵌入其中的AI,它將能夠學習人類和動物利用其感官的方式——不僅靠視覺、聽覺、味覺、嗅覺和觸覺,還包括動作或溫度——來理解周遭環境。我們的長期願景是,各種裝置將可以使用多種類型的仿生感測器來瞭解其周遭環境,並以最佳方式做出回應。」

英飛凌(Infineon)也在改變商業模式──從銷售麥克風裸晶給歌爾(Goertek)和瑞聲(AAC)等廠商,轉為銷售完整封裝的MEMS麥克風;還有從一家MEMS麥克風製造商,轉向成為提供製造、封裝、測試與銷售的一體化供應商。「這是策略的改變…大概意味著他們看到了VPA的發展,想在這個市場中佔有一席之地。」

同樣地,如今在全球MEMS麥克風市場上佔據39%比例的領導級供應商樓氏電子(Knowles),最近收購了艾邁斯半導體(Ams)的MEMS麥克風ASIC設計部門,從而取得混合訊號電路設計IP,以因應來自中國業者歌爾與瑞聲等日益激烈的競爭。

MEMS麥克風市場規模繼續擴大

全球音訊市場持續成長,由於語音VPA要求更高的訊號雜訊比(SNR),才能在吵雜的環境中準確擷取人聲,MEMS麥克風因此迎來市場新商機。

根據Yole的說法,麥克風、微型揚聲器和音訊IC的全球消費性應用市場預計將從2018年的141億美元成長到2024年的208億美元,複合年平均成長率(CAGR)為6.6%。麥克風由於價格低廉、體積小且易於整合而被廣泛採用,達到非常高的銷售量。「我們估計市場上有60億個麥克風;」Damianos指出,整體麥克風市場規模目前約17億美元,到2024年預計將增加到20億美元,複合年成長率為3%。

MEMS麥克風目前佔據整體麥克風市場約七成比例,2018年市場總值為12億美元,預計2024年將增加到16億美元;其主要驅動力包括智慧手型機、智慧音箱以及聽戴式設備(例如無線耳塞式耳機)。「在過去的幾年,智慧音箱和聽戴式設備市場歷經爆炸式成長;」Damianos表示,基本上,智慧音箱中的MEMS麥克風數量將以13%的CAGR成長,到2024年達到12億顆;無線耳塞式耳機應用的數量則將以29%的CAGR增加,到2024年達到13億顆。

20200401_MEMSmicrophone_NT31P2

在此同時,Yole的統計數字還顯示,微型揚聲器目前的市場規模為91億美元,預計到2024年將以3%的CAGR增加至109億美元。Damianos指出這看起來只是略微成長,但在2018年和2019年,智慧型手機市場成長出現趨緩,可能是因為智慧型手機越來越昂貴,導致使用者要過比較久才會換機。

「以往人們每一年半就換一次手機,現在則是每兩年半換一次,而且這個時間還在延長,我們會因此預期麥克風和微型揚聲器市場將出現衰退;」但實際上,「聽戴式設備和智慧音箱的爆炸式成長抵消了這種衰退。VPA正在推動這些裝置中麥克風和微型揚聲器的整合;」Damianos總結指出,時代正在改變。

本文同步刊登於《電子工程專輯》雜誌2002年4月號;責編:Judith Cheng

(參考原文:Where Is the Real Value in the Audio Chain?,by Anne-Françoise Pelé)

掃描或點擊QR Code立即加入 “EETimes技術論壇” Line 群組 !

 EET-Line技術論壇-QR

發表評論