或許您還沒有聽說過,2017年已經被稱為「語音介面年」了。從年初美國拉斯維加斯國際消費電子展(CES)的「語音啟動」成為最受矚目的焦點開始,話題持續延燒到年中在上海舉行的世界行動通訊大會(MWC)。這一稱號並進一步受到多家網際網路和技術巨擘的加持,他們不斷加入競賽行列並推出以智慧揚聲器為基礎的個人語音助理。

美國的智慧揚聲器

自從2014年亞馬遜(Amazon)智慧揚聲器Echo推出以來,這個市場一直呈指數級成長。根據audioxpress.com,在美國,智慧揚聲器佔家庭音訊硬體類別的30%。預計未來幾年將持續成長,到2020年將可達到1億美元的規模,其中75%的美國家庭將擁有智慧揚聲器。

Google Home揚聲器自去年發佈後,成功地佔據了一定的市場份額,但仍遠落後於Echo。根據eMarketer US對2017年的預測,Amazon Echo揚聲器將擁有70.6%的市佔率,Google Home約達到23.8%,而剩下的市場將分佈於聯想(Lenovo)、Harman Kardon和LG等市佔率更小的參與業者。

20170911_speaker_NT31P1 圖1:技術領域的各大巨擘現正競相爭奪您咖啡桌上的一小塊圓形空間 (來源:Reuters/Harman Kardon)

不過,在Apple發佈其高價位的高階揚聲器——HomePod後,這個情況即將發生重大變化。微軟(Microsoft)也將加入這場競賽,但它並非打造自家的揚聲器,而是即將推出一款名為Invoke的Harman Kardon裝置,由Cortana提供支援。今年初,進軍該市場的另一重點是Lenovo的Smart Assistant揚聲器,它將會是Amazon Alexa的新主人。使用者現在可以選擇任何一款由Alexa智慧語音服務提供支援、但不一定由Amazon製造的裝置產品。Lenovo揚聲器的音響系統也將由Harman Kardon支援。

中文智慧揚聲器為全球1/5人口敞開大門

同時,在中國,阿里巴巴(Alibaba)宣佈推出Tmall Genie X1,正式進軍智慧家庭揚聲器市場。

Tmall Genie X1It預計不久即將上市,價格大約75美元,比美國各種裝置更便宜得多。不過,中國市場本身已經開始競爭了。阿里巴巴的競爭對手之一——線上零售業的後起之秀——京東商城(JD)與iFlytek合作,在去年發表玲瓏叮咚系列智慧揚聲器。

中國搜尋引擎巨擘——百度(Baidu)則與硬體公司AiNemo合作,在智慧揚聲器領域搭建略有不同的選擇。這款稱為Little Fish的裝置是由百度的語音啟動作業系統(OS)——DuerOS提供支援。它與迄今討論的其他產品不同之處在於配備了螢幕和相機。智慧機器人可以追蹤使用者的臉部,並使用臉部辨識功能驗證線上購物。它還可以顯示資訊和影像,以回應使用者的查詢。

20170911_speaker_NT31P2 圖2:百度推出配備螢幕和相機的智慧揚聲器,可以在房間周圍對您進行追蹤 (來源:Baidu)

這與Amazon Echo產品系列的最新產品Echo Show有點類似。但相對於Little Fish,Echo Show並不能移動,所以無法在房間周圍進行追蹤。您甚至也無法手動更改螢幕的角度,所以它的限制非常多,但這是美國第一款配備螢幕的智慧揚聲器。因此,當我們看到越來越多模仿原始Amazon Echo的產品出現時,Amazon本身正開始轉向新功能。

技能組合是語音助理的差異化關鍵嗎?

這個市場的競賽還處於早期階段,而產品彼此間的相似程度令人驚訝。除了些微的設計不同,裝置的外觀幾乎沒有任何差異,只有在內部出現一些更有趣的區別。麥克風的數量存在相當大的變化,從Google Home中只用了兩支麥克風(執行遠場語音提取的最小要求),到Lenovo Assistant支援高達8支麥克風。揚聲器的數量和品質也不盡相同,在Lenovo和Apple即將推出的產品中,嘗試透過多聲道高音擴音器、室內校正和音訊波束成形等技術,從而將音訊提升到大幅超越Amazon和Google現有產品的水準。

揚聲器背後的智慧控制差異更為明顯。人工智慧(AI)平台在技能組合和可執行的任務方面並不完全相同。Alexa已經取得了15,000多種技能,遠勝於任何競爭對手的產品。根據Voicebot的說法,Google Home排名第二,僅支援378種技能。就技能組合而言,未來可能會是一大賣點以及差異化的因素。

另一個重要方面是基礎AI平台的「智慧程度」。能夠對話、理解語言的情境以及回答後續問題就是很好的例子。衡量這一點比計算技能更困難,但Google Assistant在這方面可能就超越Alexa了。一般來說,像Google和百度等搜尋巨擘可以取得大量的資料,在深度學習方面更有優勢,這將有助於其日後的發展。

目前,AI平台和實體揚聲器已經整合了,很快地就會發生變革。由於Amazon和Google已經向第三方裝置開放其服務了,因此,揚聲器硬體本身的設計對任何人都是開放的。只需藉由足以實現遠場語音拾音功能的解決方案,任何裝置都可以透過API連接到所選擇的個人助理,並提供智慧語音服務。這為晶片和裝置製造商開啟了大量的機會來建構智慧揚聲器硬體,以把握任何市場機遇。至於Apple,同樣地,該公司仍將Siri保留在自家硬體中。

打造具成本效益的低功耗SoC方案

綜合上述的所有要點,我認為這標誌著第二波智慧揚聲器的衝擊。在第二波週期,裝置製造商使用相同的幾種個人助理平台,致力於降低成本並實現大量市場。為此,他們必須在功能特性和使用者體驗之間找到最佳平衡,同時保持具競爭力的價格。此外,市場領導廠商將嘗試提升平台的技能和智慧程度,並推出新的特性功能(如螢幕和相機),以取得不同程度成功。就像十年前的智慧型手機平台戰爭一樣,儘管導致許多變化,最終將融合於消費者的達爾文「適者生存」選擇。

語音介面市場正蓬勃發展中,預計還有更多的公司加入。觀察Lenovo揚聲器和Invoke也將特別有趣,因為這象徵著語音助理本身及其消費應用產品之間「分道揚鑣」的開始。

(參考原文:The second wave of smart speakers is coming,by Moshe Sheier)