「Alexa,播放《海洋奇緣》(Moana)的電影配樂!」就在亞馬遜(Amazon)發佈Amazon Echo兩年後,‘Alexa’已經成為日常用語。隨著消費者逐漸轉向非接觸式使用者介面——如今還包括了手勢和語音,‘Okay, Google’、‘Siri’和‘Hey, Cortana’也陸續加入Alexa的語音助理陣營中。

從這些新的使用者介面中,我們能期待些什麼?微機電系統(MEMS)和感測器供應商又將如何協助我們達到目的?

首先,不要完全忽略了觸控的存在。對於個人電腦(PC)裝置以及其他以鍵盤為主的應用來說,觸控功能仍然十分重要,並且將在未來一段時間內持續其主導位置。儘管如此,有許多例子清楚顯示語音功能正變得越來越易於使用。對我來說,可視為一種預兆的是我十幾歲的女兒所做的事——打字/滑手機或使用語音介面。現在,他們仍然整天緊握著智慧型手機不放,但我加減也會看到他們啟動麥克風,以便使用語音輸入。

透過語音得以自動選擇音樂、電視節目和影片。Vesper執行長Matt Crowley解釋說,那是因為存在一種「非結構化的大量內容資料庫,很難經由分層進行瀏覽」。他並舉例說,一些任務較簡單的使用案例如設定時間、詢問天氣預報或是開門等指令,都非常適用於語音介面。

諸如智慧揚聲器和智慧耳機(smart earbud)等長時傾聽(always-listening)裝置也是語音介面的理想應用。然而,最吸引人之處在於這些長時傾聽的MEMS麥克風對於這種裝置最重要之處在於它必須十分節能。為此,諸如Vesper和InvenSense等業界MEMS麥克風製造商分別以不同的方式克服了功耗問題。

Vesper提供長時傾聽的壓電MEMS麥克風——使用聲音能量本身來喚醒睡眠模式下的裝置,同時,它所消耗的功率幾乎是零。InvenSense則提倡更高整合度,例如整合類比數位轉換器(ADC)與麥克風的MEMS麥克風,可節省ADC經常消耗的所有功耗。

除了語音使用者介面,還有新的手勢技術也開始加入市場,而且,設計人員正競相將這種技術整合於產品中。

基於MEMS的超音波飛行時間(ToF)感測器讓消費裝置——包括虛擬實境(VR)/擴增實境(AR)系統,以3維(3D)空間方式偵測動作、深度以及物體的位置。因為大部份的現有3D感測技術都是以可見光或紅外線等光源為基礎,一到陽光下就會發生問題,因為它可能會造成光收發器的負載。此外,也很難用於偵測深色或光學透明表面,例如玻璃窗。相形之下,超音波技術可在任何光線條件下使用,對於物體的色彩也不那麼敏感,因而能「看」到所有固態的形體;而且,在超音波的頻段中也不會出現許多背景雜訊,因而功率極低。

不過,Chirp Microsystems技術長David Horsley指出:「超音波的挑戰就在於它對於消費電子產品而言,還算是一項新技術,因此,許多客戶並不熟悉它的功能。」

在觸控介面要求太多使用者注意力的情境——例如在行車中,要找到正確的觸控位置可能會導致駕駛分心。Horsley說,想像一下,只要揮揮手就能進行調整,而不必手忙腳亂地在小螢幕上找應用程式,將會多麼具有吸引力啊!他還補充說,將超音波感測技術應用在VR/AR時,可支援控制器「由內而外追蹤」(inside-out tracking)或具有6自由度的輸入裝置,讓使用者在與VR/AR環互動時不必受限於基地台範圍或指定的空間中。

機器學習(machine learning)則更進一步促進使用戶介面發展,特別是在AR/VR等應用中。Virtuix總裁David Allen問道:「使用者介面的演變讓我們能從敲打鍵盤進展到在玻璃上滑動。接下來會是什麼?」

「答案就在於混合實境(mixed reality;MR)——一種虛幻與現的融合。今天,你可以將智慧型手機攝影機指向某個真實的目標,就會看到疊加在上面的粗略虛擬影像——例如Snapchat Lenses或Pok?mon Go。明日,我們的裝置預計就能在真實世界投射出一個清晰的使用者介面。這項技術就是由MEMS和感測器共同實現的,它能實現「同步定位與映射」,即SLAM。未來,預計將會看到更多基於SLAM的應用,包括行動機器人以及自動駕駛車等。

TDK生態系統資深總監Nicolas Sauvage讓我開始質疑自己是否能區別家中的狗和早餐。Sauvage引用私人創投(VC)公司Andreesen Horowitz最近在簡報時提到的機器學習案例表示,「透過機器學習,只要將智慧型手機指向某個人、一隻狗或一個物體,就會看到該焦點上的資訊或有趣的動畫。」Sauvage指出,機器學習在辨識諸如狗或馬芬蛋糕(muffin)等物體的能力已大幅提升了。事上,根據該VC的簡報資料,編程人員所開發的演算法中,只有72%的最佳演算法能夠辨別二者的不同,而機器學習用於辨識的正確率卻達到了93%!

20170914_UI_NT02P1 狗在哪裡?馬芬蛋糕在哪裡?機器學習比人類更能正確回答這些問題 (來源:Imagenet)

隨著消費者越來越熱衷於更自在且自然地與數位世界互動,我們可以預期未來還將出現更多使用MEMS和感測器的其他UI替代方案,從而使得裝置更加智慧化,也更環保。此外,我們也可以期待MEMS和感測器能將更高品質的資料傳回電子裝置,執行機器學習或人工智慧,從而提供更有用或甚至更人性化的資訊。

儘管我們經由新的使用者介面取得了諸多好處,但是,科技產業將如何處理電子裝置always-on的潛在隱私問題,目前仍有待進一步地討論。

編譯:Susan Hong

(參考原文:March of the Touchless User Interfaces,by Karen Lightman, vice president, MEMS & Sensors Industry Group, SEMI.)