我們已經與深度學習與大規模神經網路一起生活,事實證明也有越來越多應用程式仰賴電腦視覺、語言理解以及機器人等技術;而如同Google資深院士Jeff Dean在近日於美國舊金山舉行的SIGMOD 2016大會發表專題演說時所言,我們現在最需要從機器學習中取得的是「理解力(understanding)」。

「我們現在有充足的運算資源,以及足夠大規模的、有趣的資料集;」Dean對SIGMOD大會的聽眾們表示:「我們可以儲存大量的有趣資料,但我們真正需要的是理解那些資料。」

在專題演說中,Dean概述了機器學習(machine learning,ML)與神經網路的歷史,還有利用以影音呈現的原始資料編程模型之不同方法;他也詳細介紹Google初具規模的ML研究成果,該公司最近將在歐洲設置一個機器學習研究中心。Google繼去年發表TensorFlow演算法後,又宣佈自己開發了命名為張量處理單元(TPU)的人工智慧加速器晶片(參考閱讀)。

Dean表示:「隨著時間推移,我們看到越來越多利用ML技術來解決各種問題的成功案例,這導致了Google內部數百個開發團隊對相關技術的使用出現真正大幅度成長。」

20160629 DeepLearning NT03P1

Google對深度學習技術的使用趨勢
(來源:SIGMOD/Jeff Dean)

Dean舉例指出,Google的語音識別開發團隊,透過利用神經網路將字詞錯誤率降低了30%;該團隊以神經網路取代了語音識別流水線(pipeline)的聲學模型──也就是利用原始音波來判別聲音與字詞──並達成了二十年來最大幅度的改善成果。

利用機器學習與神經網路技術解決的基礎性問題,也能在其他領域看到,例如醫療與衛星影像;在這些案例中,可能是需要在地圖上識別某棟房子以勘查太陽能光電板的安裝,或是進行糖尿病患黃斑部病變的篩選。用於語音識別的相同模型,可以輕易被利用來解決其他問題。

「那些模型有很多類似的地方;」Dean指出,Google翻譯應用程式現在可以利用畫素識別(pixel identification),即時將符號翻譯成不同語言。

機器學習的未來發展

不過在機器學習以及神經網路的理解能力發展方面,還有一些待克服的障礙;包括模型必須要能在無人監督的狀況下學習、處理多工任務並轉換學習,還有根據現實世界情況採取行動(也被稱為強化學習)。

Dean表示,研究人員已經開始關注機器學習的隱私保護技術,並將該模型架構添加到mdash廣告程式中;在這部分的機器學習中,人類的互動扮演在權衡時扮演重要角色,是很大的進步:「確保你提供的資料實際遵循你想要的隱私權政策很重要,或者你可以強加更高層級的政策到模型之上。」

從系統的角度來看,Dean表示下一個挑戰是如何:「利用高層級的機器語言演算法描述,以及將那些不同的描述映射到廣泛的不同硬體上;」他也期望能將機器學習整合到更多傳統的資料處理方案中。

摩爾定律(Moore’s Law)的尾端為機器學習提供了有趣的發展方向,Dean預期會有越來越多進行機器學習運算的異質或特製硬體;Google的TensorFlow ASIC是一個例子,而最近則是嘗試利用以TensorFlow啟動的機器人進行大規模資料收集。

「我認為這一次神經網路已經準備就緒;在90年代,我認為它們雖然帶來很多激勵,但就是缺乏運算資源。而現在,我想該類技術已經展現它們能解決相關有趣問題的能力;」Dean結論指出:「如果你還沒考慮如何為資料庫提供深度神經網路,現在應該要開始了。」

編譯:Judith Cheng

(參考原文: Google Fellow Talks Neural Nets, Deep Learning,by Jessica Lipsky)