智慧家庭(Smart Home)雖然已經是發展很久的議題,但市場發展似乎未成有爆發性的成長,不過,智慧家庭在加入語音助理之後,2018年的發展可望更上一層樓。2018年消費性電子大展(CES)中,各家大廠如亞馬遜(Amazon)、蘋果(Apple)、Google、三星(Samsung)、樂金(LG)、海爾(Haier)…等服務或家電製造業者,紛紛相互結盟,並展出最新智慧家庭產品。

值得關注的是,智慧語音助理結合智慧家電,在2017年逐漸發酵後,2018年將可看到更多借助智慧語音助理的應用及系統真正出現在生活周遭,為智慧家庭市場挹注更有力的發展動能。

語音控制為智慧家庭市場注入活水

從今年CES觀察,智慧家庭依然是相關業者主要的發展目標。根據市調單位調查統計,到2025年,全球將有10%的家庭可以稱為智慧家庭。而智慧家庭所創造的市場產值,根據GfK報告,2015年達485億美元,隨後成長態勢逐漸趨緩,預計仍維持每年約80億美元的成長速度,預期2018年市場規模將達710億美元。單就智慧家庭設備產值來看,若不將家電等大型設備計算在內,到2021年智慧家庭設備營業額將可成長到95億美元。

此外,根據智慧家庭實驗室講師林祐祺引用國外市調機構所做的統計,2015~2020年間,智慧家庭年複合成長率(CAGR)將達50%。台灣經濟部也預估,若以台灣800萬戶家庭,滲透率25%來計算,每個月支出2,000元,預期110年台灣智慧家庭服務年產值可達新台幣480億元。

這些成長估算數字,對相關業者來說可能相當具有吸引力,然而要讓智慧家庭持續成長,近年備受矚目的語音控制可謂功不可沒。雖然語音助理的概念是由Apple智慧型手機中的Siri所開啟,但Amazon Echo智慧音箱卻是最快跳脫手機之外,讓語音助理在智慧家庭「發光發熱」的裝置,逼得Google、Apple相繼跟進,以強化其在智慧家庭市場的佔有率及地位。

因此可以說,智慧家庭市場的新一波高潮,是由語音控制所激起。博雲智能(Link of Things)執行長張伯維表示,對於老人或非智慧裝置的重度使用者來說,要花時間了解或是操作手機應用程式(App)或是家庭的控制面板,相當有難度。透過語音,可以更直接的下達指令,操作相對簡單,因此不僅智慧家庭相關大廠看好語音控制在智慧家庭的發展力道,其他應用領域,包括車用、室內定位…等,都已開始導入語音控制這項既有卻直至近期才更有發揮空間的技術。

20180402_Voice_NT31P1 智慧家庭語音控制運作架構(來源:博雲智能)

相對的,也因語音控制直覺、簡單易用的特性,刺激消費者對於導入智慧家庭的意願更高。再者Amazon透過低價補貼方式,將Echo智慧喇叭賣給其電子商務的PRIME會員,雖然是打造新型態的線上購物使用體驗,但也同時助長了智慧家庭的發展。換句話說,無論是Google、Apple或是微軟(Microsoft)等平台業者,透過語音控制技術讓更多型式的智慧裝置能在家中的生活空間取得更大的地位,讓更多物聯網(IoT)裝置更容易進入家庭的領域,所以語音助理的應用不僅為家庭生活帶來更多的驚奇,也進而帶動智慧家庭在2018年有較明顯的進展。

也因此2018年CES已可見到有更多的家電、鬧鐘或是其他產品不但可連網,並具備可透過Alexa、Google個人助理(Google Assistant)或Siri控制的特性。CEVA行銷策略總監Moshe Sheier表示,語音是最自然的人機介面,它可執行觸控及手勢做不到的免持操作,因此成為控制智慧家庭裝置的理想方式。除此之外,與繁忙的辦公室或吵雜的街道相比,家庭是一個相當私人、安靜而狹窄的場所,因而也較適合語音控制的使用環境,因此在家庭中採用語音控制可說是順理成章。

現今最流行的智慧家庭語音控制設備是智慧音箱,例如Amazon Echo或Google Home,以及用於控制智慧家庭裝置的雲端虛擬助理。透過連接智慧音箱到其他智慧家庭設備,可以實現多重裝置的語音控制,例如提供語音命令,像是「Alexa,請Blink啟動我家的安全系統。」因此,以一個聰明的智慧音箱可作為私人音訊管家為出發點,智慧家庭將更為便利,未來也可能更「個性化」。

不過,即使語音助理可望為智慧家庭挹注新的發展動能,但單靠語音控制就能讓智慧家庭的發展持續暢旺嗎?當然不會那麼容易。

標準化至關重要

何以智慧家庭先前未能顯著成長?Nordic Semiconductor區域業務經理陳俊志表示,即使先前業者普遍認為只要將裝置加上連網功能,勢必能帶動智慧家庭的成長,但事實上,智慧家庭並非裝置連網即能「坐等營收滾滾來」,背後牽涉到許多連網所衍生的相關問題。

Sheier認為,目前的智慧家庭裝置是把智慧功能內建到設備本身的單點設備,可稱為「邊緣運算」(Edge computing)或結合了由雲端系統軟體提供的智慧和分析功能。流行的智慧家庭設備是連接到網際網路的新版本傳統家用產品,像是恆溫器、照明、車庫門遙控器和門鎖等等。不過,今天現有的這些設備大多各自分散,儘管它們都身處於相同的無線網路中,但彼此之間沒有連接。

也就是說,連網技術百百種,哪一種最合適?各家業者自然有心中「最佳人選」,但連帶造成連網技術不同,各家產品無法互通,甚至雲端系統也無法共通,「各自為政」的結果導致消費者使用上的不便,進而降低使用意願。

不僅如此,智慧家庭整體也並未有共通的雲端服務標準可以讓業者追尋,終端製造商必須跟著雲端服務供應商及網通產品相關製造商的腳步,才能製造出可通用於市場的產品。然而能讓業者稍感安慰的是,目前市面上智慧家庭雲端服務僅有Apple、Google、Amaon三大巨頭,財力較大的業者可在產品中都支援三大業者的自有智慧家庭標準,但是財力較小的公司,只能依靠過人的「靈感」,擇一押寶。

沒有互連為一個完整智慧家庭網路的裝置,沒有能夠使用單一的網通產品連上單一雲端進行控制或是資訊分析,消費者可能必須在手機針對不同廠商的品下載一個應用程式,或者是在家中得擺上不同廠牌的遙控器,每次使用就得「猜」是否開對應用程式或拿對遙控器。若是你,這樣的智慧家庭使用環境,能接受嗎?

消費者不想用智慧家庭產品,智慧家庭的市場發展自然令人無感。不過2018年情況已開始改變。

百花齊放通訊技術標準正在收斂

博雲智能技術長王雲龍指出,智慧家庭要能大力發展起來必須天時地利人和,也就是整體生態系統、連網裝置與雲端服務都要相對成熟,且需要統一標準消弭不相容問題,再加上要克服進入門檻,簡易安裝步驟,提升消費者使用經驗,才能有較好的開展。

在此之前,可透過雲端服務將智慧家庭的家電產品串連起來,但這並非百分之百的解決之道,所幸,已有大廠開始進行標準融合的工作,可望加速解決智慧家庭連網裝置不相容的問題。陳俊志認為,2018年的智慧家庭百花齊放的通訊標準,不僅會慢慢收斂為主流的幾項技術,如藍牙(Bluetooth)、Thread、ZigBee或Wi-Fi...等,還會出現能夠支援多種標準的單一裝置。如此一來,一方面可以降低產品設計複雜度,使各家業者的產品能進一步相容,還能使裝置與雲端之間的閘道器(gateway)消失。

陳俊志解釋,所謂的讓閘道器消失,例如,手機並未內建ZigBee,若要透過手機控制家中內建ZigBee的燈具,或是ZigBee燈具的資料要上傳導到雲端時,都需要透過額外的閘道器作為中介。若是單一裝置支援多重標準,意味著,裝置本身可以依據要執行的工作選擇相對應的技術,如透過ZigBee下控制、要與手機連結將資料傳上雲端時切換為使用藍牙,就不需要再透過閘道器,使用者在使用上也能更加簡便、在建置智慧家庭系統時也可更為容易。

業者普遍認為,目前燈具控制部分已採用ZigBee為大宗;而若需要透過手機連接則以藍牙為主。意法半導體(STMicroelectronics)亞太區類比、微機電與感測元件資深技術行銷工程師謝景翔則表示,觀察現階段智慧家庭連網裝置的發展,可發現藍牙5.0因擁有網狀網路(mesh)與低功耗的特性,有後來居上的態勢,未來智慧家庭裝置內建藍牙5.0的比重將逐漸增加。

這並不是說其他的短距低功耗通訊技術會完全被排除,而是在不同的使用環境下會有最適用的通訊技術出現,並逐漸收斂為只剩幾項主流無線技術,這正呼應智慧家庭單一裝置支援多重無線標準的發展趨勢。且這也顯示業者的想法,技術那麼多,支持者也眾多,押對寶也不容易,更不可能只有一種無線通訊技術能夠獨大,因此將最有可能的幾項技術挑出來,在單一晶片中全數支援,或者與第三方進一步合作,將是最佳的方式。

20180402_Voice_NT31P2 未來智慧家庭各類系統的控制將無須動手,僅需動口(來源:Arctic Air)

選邊站時刻來臨

將龐雜的無線技術「理清」後,還有雲端辨識與服務系統的問題需要解決。不僅如此,大多數業者都無法做到由上至下的垂直整合,專精的技術可能只佔整體生態系統的某一部分,因此得與多方公司進行合作,這將提高產品研發成本與難度,而這也導致業者得面臨選邊站的時刻。

張伯維說明,目前三大雲端服務供應商各自有自己的雲端服務平台,且透過語音控制智慧家庭裝置,產品更是需要支援三大業者的雲端平台,才能使語音控制系統得以精確辨識語音指令及運作順暢。但並非所有的廠商皆有能力同時支援不同的雲端服務平台,此時廠商僅能依市場發展風向,選擇何種語音辨識技術與雲端平台。

據了解,目前三大巨頭勢力消長情況,前兩年已Apple HomeKit較為熱門,今年是Amazon獨領風騷。明年是否會換成Google Home熱度較高,實在很難說得準,且這三大廠商未來是否會有在智慧音箱之外整合其他周邊的產品計畫,也尚未明朗,這也相對考驗廠商對於智慧家庭產品的設計佈局。

而語音控制技術未來是否能夠標準化?王雲龍認為,因牽涉到利益的問題,大廠是否開放其語音相關關鍵性技術,也仍在未定之天,也許未來業者彼此間會進一步組成策略聯盟,推展某一項智慧家庭或語音控制技術,但現階段業者僅能以何種技術使用率較高作為選擇的依據。

Sheier亦觀察到智慧家庭產業開始趨向整合的情況。他提到,未來,這些智慧家庭連網設備將透過中央集線器不斷增加彼此的互連,從而實現「深層連接」(deep linking)。深層連接亦即讓來自不同供應商和使用各種應用程式介面(API)的不同產品彼此互連,以提供更優異的用戶體驗。例如,一個智慧家庭系統能於門鈴攝影機辨識出主人離開家時降低供熱溫度、關閉燈光並鎖上大門及啟動安全系統。最近Amazon以10億美元收購Ring,即反映智慧家庭解決方案供應商正在尋求更深度的垂直整合以擴大其產品組合,一方面希望能夠主導智慧家庭生態系統,一方面能夠提供更無縫連接的智慧家庭解決方案予消費者。

技術日新月異 強化語音控制精確度

智慧家庭或是語音控制標準的收斂之外,還是得考慮現階段語音控制技術仍有哪些技術上的不足與未來發展,才能使語音控制技術能夠更深入到人們的日常生活,發展腳步能更加穩健。

Simple Care開放長照智慧系統產品設計林志豪表示,以智慧音箱來說,現在大部分的使用者還是用來聽音樂為主,使用者對於其精準度的要求大約是在對智慧音箱下指令時,才較為重視,也就是在使用者說的時候要精準。

林志豪進一步解釋「精準」的定義,例如,透過Echo下達播放音樂的指令時,若是講了跟播放音樂無關的幾句話,Echo可能就無法辨識,而人類卻可以透過關鍵字就可清楚地知道哪些是真正的指令,而那些語句是廢話。另外,現今的語音辨識技術對於斷句不明確、台灣國語或是語義部分的辨識度也有待加強,這不僅對使用者而言會產生困擾,也是當前語音辨識需突破的技術面問題。

Sheier則認為,目前自動語音辨識(ASR)和前端語音處理的最新發展已使得語音控制相當成熟和有效。ASR引擎可以理解多種語言和口音,而語音生物辨識可用於辨識系統中預先登錄的特定用戶,以在智慧家庭環境中提供不同的權限。但是,目前的技術仍然限制在5公尺的範圍內,並且難以在多人同時交談或吵雜的環境中操作。

AI推一把 語音辨識更精確

上述的問題在人工智慧(AI)進入到語音辨識技術後,相信可迎刃而解。林志豪認為,自然語言處理(NLP)漸漸的會解決斷句、語義…等問題,因為自然語言處理已漸可做到情感語義分析,肯定可以判斷某一些句子是無意義的「雜訊」。不過,如何將AI順利加入到語音控制裝置中,這也將考驗業者的能力。

不僅如此,現在主流語音辨識技術,由於開發者主要的語言使用環境是透過英文,因此許多非英語系國家消費者在使用語音控制時,有時會面臨系統突然「聽不懂」的狀況。不過隨著人工智慧的導入語音辨識軟體演算法的能力可望不斷提升,可預期未來語音辨識技術會更加適用於非英語系國家。

MEMS麥克風扮演重要硬體角色

軟體演算法的精進,也需要配合較佳的硬體麥克風相輔相成,才能提供使用者較佳的使用經驗。謝景翔指出,語音控制或是智慧音箱對於微機電系統(MEMS)麥克風的要求是,首先是高辨識度、再來則是靈敏度、麥克風的效能與更優異的訊噪比(SNR)。

意法半導體類比、微機電與感測元件技術行銷經理陳建成補充,要讓數位或類比訊號的麥克風更能符合語音控制技術的需求,業者皆致力於在縮小封裝、降低功耗、強化聲學過載點(AOP)效能,以及更好的訊噪比表現。其中,聲學過載點的表現越佳,智慧音箱在吵雜的環境中,收到的聲音不會過於失真,也能過濾掉背景雜音。

除了辨識軟體精確度及硬體產品的加持外,語音控制技術也面臨非技術性的挑戰。Sheier指出,一些非技術性的挑戰例如隱私,可說是消費者主要關心的一個問題。使用者也許會思考,「語音控制設備是否一直在記錄我的每句說話?」、「我所說的每一句話,會不會透過智慧音箱被有心人士聽到?」

為了消弭使用者的疑慮,相關業者也戮力研發新技術以克服這些挑戰。例如把不同用戶說的話分離,這就牽涉到利用複雜演算法來分離每個用戶的語音,且能夠理解語音串流方向,知道哪些涉及語音命令,哪些只是背景人聲。另一個即將出現的趨勢是採用更多的終端設備邊緣處理(on-device edge computing)功能,以便在沒有雲端系統連接的情況下實現語音控制和聲音感測,從而改善延遲和隱私。未來幾年內將可看到採用這些技術的智慧揚聲器和其他語音控制設備。

林志豪提醒,非技術面的挑戰將以跳脫智慧音箱至所有特殊產品上,例如照護上的使用者介面,假設是給獨居長輩使用,有沒有辦法串接的很人性化,讓老人家在也可「無痛」使用?例如語音對語言的轉換、是否要接上網路線、電話線或是插上SIM卡,以保持網路通訊訊號暢通?另外,對外連網的技術也很重要。

對此,陳俊志表示,智慧家庭中的無線短距網路,在傳輸語音封包時,會先將封包壓縮,以利於其既有的頻寬速度可順利進行傳輸。上述的一些技術與非技術面考量皆可透過軟體與硬體解決,而使用者對語音控制技術較大的非技術面考量,是否採用該技術的關鍵,主要為安全性。

安全性為重要考量

影響語音控制技術進入到智慧家庭或其他應用領域的原因很多,包括使用者的習慣是否被建立、是否提供更多「控制」功能以外的附加價值、是否有更「特別」的應用出現,以及安全性的問題。其中,安全性可說是消費者最為關注的部分。

陳俊志說明,語音控制因為牽涉到網路傳輸的部分,因此勢必會引發消費者對其安全性的疑慮,不過現在各傳輸技術都有其獨特的加解密方式,也有相關晶片業者專注於安全晶片的研發,應該可以解決消費者的擔心。更何況,現今的駭客會選擇對其「有用」的內容,做入侵、擷取或破解的動作,一般的家電控制命令語音,對駭客的吸引力可能相對較低。

張伯維補充,不僅駭客令人擔憂,智慧音箱能否忽略錯誤的指令,或是識別證確的說話者,如小朋友惡作劇亂下指令、小偷用語音開啟家中門鎖…等狀況,也是讓使用者相當頭痛的安全性問題。此時即可彰顯語音控制結合聲紋辨識的重要性,目前仍是得觀察大廠的語音辨識入口是否會加上聲紋辨識功能,才能進一步實現在終端產品上。然而,加入聲紋辨識不但可提高安全度,也可以讓產品製造商推出更「個性化」的專屬產品,因此可預期未來市面上也會出現加入聲紋辨識技術的語音控制產品。

跳脫控制領域 未來路更長遠

未來智慧家庭語音控制會如何變化?殺手級應用又會出現在哪裡?業者普遍認為,語音控制若不只是被動的收音、下指令,而能轉變為雙向的溝通,並可提供更多資訊,例如針對天氣給予使用者穿衣服的建議、提供食譜…等,抑或者不限於單一的智慧音箱,而是分散於多個裝置,進一步解決控制命令無法「翻牆」傳輸到另一個房間的問題,這樣將可更提高使用者的使用意願。

林志豪認為,目前語音控制應用的大宗在手機上的就是看天氣、行事歷、打電話與播放音樂,而在手機以外的裝置上,幾乎還是以音箱控制為大宗。但目前情況有一點變化,例如從台灣之光阿福寶(AfoBot)與華碩(Asus)Zenbo,可以發現由單一的音箱產品,轉變為機器人產品,雖然量還不大,漸漸的可以發現差異化產品的出現。

另外,語音控制在居家照護,以及可「聽聲辨位」的室內定位也可望有更大的發揮空間;且BMW也宣佈將在2018年的車款加裝Alexa,協助駕駛應付更多行車狀況,開車時將不再手忙腳亂。謝景翔指表示,智慧家庭在語音控制之外,若能再結合視覺的應用,將有更多發展空間,如門鈴如果能結合語音與人臉辨識,即可提供多重的安全保障,可望提高消費者的接受度。

由於智慧音箱唯一用途就是擔任語音助理,以語音負責中央控制角色,成為家庭中心,因此Consumer Technology Association(CTA)預測,智慧音箱仍有1~2年的爆發成長,美國市場約在2020年開始衰退,全球市場可能到2022年才會開始衰退。

為讓語音控制技術走的更長遠,Amazon 將Alexa雲端架構都開放給有興趣做大語音控制市場的業者使用,讓大量低階連網裝置也可以導入Alexa,從個人電腦、智慧型手機到智慧電視,各種裝置都能夠收聽指令。因此,當語音助理大量滲透到其他行動裝置,智慧音箱將不再是家裡唯一的語音入口,即便如此,此舉卻能讓語音助理有機會變成消費者「非用不可」的技術。