在科技方面,我們總幻想著下一個偉大發明;新聞快訊:偉大發明已經出現了。自從智慧型手機出現之後,智慧喇叭迅速獲得消費者接受;光是在今年的第一季,全球智慧喇叭的出貨量就達到了920萬個單位。

這個結果應該在意料之中,智慧型手機讓我們能一手掌握電話、電腦、娛樂、文字瀏覽與更多功能,而智慧助理能提供上述所有功能,但不需要我們親自拿著裝置或在裝置上打字,我們只要對著智慧喇叭提出問題與指令就行。

在第一波的智慧助理中,Amazon Echo與Google Home引進了全新的家用電器,並支援語音提示的網路搜索,接著很快拓展為可以控制其他設備,包括電視、自動恆溫器與其他設備。便利性與競爭性推動了第二波的成本降低與多樣形式因子:出現在Amazon Echo Dot、Google Home mini、阿里巴巴的Tmall Genie,以及小米的小愛同學音箱。

科技公司積極追逐這個事業,因為他們看見對於聲控智慧家庭(以及讓其他所有物品智慧化)的收入潛力。這個智慧型手機市場在去年底已逼近了5,000億美元,估計在2023年前,這個智慧家庭市場將會達到1,550億美元,使其成為極有價值的下一個偉大發明。在這個市場中,智慧喇叭的年複合成長率(CAGR)估計到了2020年將會接近50%,目前是由Amazon、Google與阿里巴巴佔據鼇頭,他們都察覺到智慧市場的快速發展,企業皆忙亂地想確保自己能分食與控制這個行動的一部份。

既然我們能看見可能的發展,因此注意力也轉向對此科技的有效利用。有一部份是拓展家庭控制:再也不需要遙控器、控制面版或手機應用程式。使用者應能全部透過語音互動就控制電視、音樂、微波爐、烤箱、空調、前門。透過更優秀的自然語言處理(NLP)以及和更多服務連線、回答天氣相關問題、確認你的行事曆、完成網路購物、代叫Uber,我們可以預見現代的雲端型智慧助理將有更多進展。

20180727_CEVA_NT71P1 家中的隱形智慧助理(來源:CEVA)

這個進化已經推動了第三波變化:電視現在可以透過遙控器使用語音控制(一小步進展——你還是可以丟掉遙控器),我們有各種聲控設備,包括手錶(遠優於觸控介面)、耳塞式耳機、頭戴式耳機、鬧鐘、掃地機器人,甚至燈泡也能聲控。現在,認為任何電子設備都能透過語音指令控制是非常合理的想像(「微波爐,解凍5分鐘」)。三星在家電用品自動化方面已展現了優秀表現,他們宣佈「希望在 2020年前每個家電都能跟使用者說話。」

這聽起來再自然不過了。通用型智慧助理(客廳裡的智慧喇叭)應該能控制所有這些裝置,但它們並不總是最佳選擇,或許是它們的位置正巧不在你想控制的裝置附近。在多種家電內建聲控功能已變成強制選項,這些供應商也能轉向第三方解決方案,讓雲端型NLP(如Amazon語音服務)增加使用者經驗。

這個隱形智慧助理無所不在的第三波發展,將不會只把智慧控制加入我們的家中(還有辦公室與許多其他場所),隱形智慧助理也將讓我們從中央控制中解放;再也不需要遙控器、不必操控智慧型手機上的應用程式、甚至不需要四散在家裡的第一波智慧喇叭了。想控制某個家電?告訴附近的語音助理就好。到了那個時候,就再也不需要考慮智慧控制中心了——智慧助理變得隨處可用。

20180727_CEVA_NT71P2 自動化隱形智慧助理(資料來源:CEVA)

想讓這一切想像成真需要有哪些進展?語音啟動與辨識硬體、軟體,就從精密、低耗能的高效能DSP型科技開始。如同你現在使用的智慧助理一樣,它必須支援多種麥克風,以及波束成型技術與精密雜訊及回音消除,才能有效地從背景雜音及其他說話聲中分辨出位於房間另一端的喇叭。它應該要至少能辨識出觸發用語(「Alexa」、「好,Google」、「微波爐」),甚至驗證使用者。要仰賴雲端的資訊往返,只會讓觸發辨識與驗證耗費太多時間(及消耗太多電力)。這個解決方案也需要支援「干預」——讓你可以中途打斷正在播放音樂及回應你的隱形智慧助理。另外,若這個裝置是由電池供電,就需要以很低的待機電力運作。

例如,CEVA為這類型的解決方案建立及部署科技,在其CEVA-TeakLite-4與CEVA-X2音訊/語音DSP IP,以及提供跨不同市場需求演算法支援,以分辨語音及啟動的ClearVox軟體之間,為客戶提供低功耗、低系統成本與高度可靠的解決方案。增加麥克風、自動語音辨識,以及和某些辨識層級的連線,產品就能擁有聲控功能,立即變得與眾不同。

(參考原文:Intelligence Untethered -- The Invisible Smart Assistant,by Youval Nachum)