成立於2014年、已於美國公開上市的人工智慧(AI)作業系統供應商Veritone,正在透過對AI提供多引擎「編排」(orchestration),來解決現實世界有如大海撈針般的資料認知(data cognition)問題,其目標是簡化流程並提高準確度。

Veritone表示,該公司aiWare平台的最新一代「指揮」(Conductor)軟體層,能於長度達數千小時的影音資料中找到人們想要的片段;就像是交響樂團指揮率領一群音樂家,呈現出有凝聚力的音樂表演。Conductor軟體能智慧地編排多個獨立認知引擎──是從大約112種第三方合作廠商的引擎中選出,並會提示從不同角度最適合解決手邊認知問題的引擎。

20170828_AIOS_NT02P1

這些螢幕截圖是Conductor軟體進行多個與美國總統Donald Trump相關搜尋的畫面;該軟體能同步搜尋關鍵字、視訊、圖片以及其他認知類別
(來源:Veritone)

舉例來說,Veritone聲稱最近從長達3萬3,000小時的對話錄影中,找到長度約140小時的相關視訊片段,相較於實際播放錄影、由人工來分析的方法,能為客戶節省高達數百萬美元的成本。

20170828_AIOS_NT02P2

Conductor可以從Bloomberg TV女主播Emily Chang在網路上的一張照片(上),從視訊中找到有她的畫面(下方)
(來源:Veritone)

Veritone合作夥伴生態系統副總裁暨總經理Tyler Schulze接受EE Times採訪時表示:「我們的完整平台是aiWare,有一整套的應用程式在軟體堆疊的最頂層,能從網路攝影機、雲端連結、各種感測器吸收任何結構化或非結構化資料。」

「Conductor從認知層選擇要用哪一種引擎,而時間彈性資料庫(temporal elastic database)會在不同的資料流速度中處理時間校正;」他指出,使用者只會看到最頂部的應用層,該應用層支援任何數量的認知類別同步搜尋。

aiWare號稱是市場上第一套AI作業系統,實際上以兩個程序運作;首先是對音訊(如對話或竊聽的側錄)、視訊(如閉路電視畫面、儀表板紀錄或是警方佩帶的攝影機)或其他資料流採樣,然後Conductor軟體層會先做初步分析,指出哪一個(或是哪幾個) AI引擎最適合解決這個認知問題。接下來該平台會將完整的資料流提交給選定的AI引擎,從中提取所需要的片段。

有時候為了提供更具效用的見解,該平台會利用不同的專屬AI引擎執行多次程序,以填補遺漏並達到客戶想要的精確程度。

20170828_AIOS_NT02P3

Conductor採用轉錄(Transcription)與情緒(Sentiment)引擎,來分析一段公開演說的媒體片段
(來源:Veritone)

該公司表示,這種經過編排、多引擎的方法,與單一AI引擎解決方案所獲得的結果相較,在精確度上提升了7%,速度與便利性則提升了99%;Veritone的Conductor軟體一開始業務模式僅限於軟體即服務(software-as-a-servic),但端看使用者需要的認知引擎,也能在某些特定情況下於客戶公司內部執行,甚至在一台筆記型電腦上運作。

在此同時,Veritone正在為Conductor升級,好在單一資料流的不同元素同步執行AI引擎;這是考量到資料不同元素有不同的品質與精確度需求;該公司已經為添加可識別人類情緒、建立影音簽名(signatures)的AI引擎,舉例來說,Conductor能以警察佩帶的攝影機鏡頭,來幫助識別嫌疑犯以及確保責任歸屬。

20170828_AIOS_NT02P4

Conductor分析警察佩帶的攝影機畫面,有一個手臂刺青的男人攜帶了半自動手槍
(來源:Veritone)

Veritone也透過佈置認知引擎,讓其平台能處理情境資料(contextual data)、光學字元(optical character)識別、車牌識別、商標識別以及其他特殊識別問題,其目標是讓該方案精確度相較單一AI引擎分析結果的提升程度達到兩位數字。

編譯:Judith Cheng

(參考原文:AI OS ‘Orchestrates’ Cognition,by R. Colin Johnson)