軟體供應商Columbus Collaboratory已經將IBM的華生(Watson)超級電腦,藉由CognizeR軟體工具整合到R程式語言中。

屬於開放源碼的R程式語言,已經獲得全球數以百萬計的工程師、科學家、統計學者與研究人員採用,現在能直接存取在IBM的Bluemix雲端服務上的Watson;至於提供R語言工具CognizeR (點此可下載)的公司Columbus Collaboratory,實際上是一個由多家業者組成的生態系統,專注於彙整一個公用的開放源碼資料庫,以支援先進的資料分析與網路安全。

做為由IBM提供的首要人工智慧(AI)解決方案,Watson在過去得要求每一個被開發為利用其服務的應用程式,透過人工編碼呼叫(calls)其應用程式介面(API);而CognizeR工具透過將一系列具備安全防護功能的內建呼叫插入越來越受歡迎的R語言,簡化了存取Watson的「感知AI (Cognitive AI)」功能的步驟。

對此市場研究機構IDC的感知系統暨內容分析研究員David Schubmehl接受EE Times訪問時表示,以上訊息的重要性在於,有越來越多人開始採用像是R語言這樣的標準統計套件(statistical packages),而對於利用IBM雲端服務BlueMix 進行的建模與深度學習任務,Watson的API服務也已經成為一個可行選項。

他指出:「R語言使用者可以利用Watson API進行文本分析(text analytics),並在非結構化資訊(unstructured information)中進行篩選,而不是像目前這樣,只能存取結構化的訊息。」

IBM估計,今日全球有90億台連網裝置、每天產生2.5 Quintillion bytes的新資訊;而IDC則預期,到2020年,世界上每一個人平均將在每秒產生1.7 megabytes大小的非結構性資訊,例如線上聊天內容、電子郵件、社交網路訊息、影像以及文件檔案;但目前這些資料只有不到1%的比例能被分析並且利用,而能挖掘更多這類非結構性資料的內容,將會是填補資料分析鴻溝的重要關鍵。

藉由在益智問答節目Jeopardy中勝出,Watson證明了它能夠以高於人類的速度,篩選記憶體中的非結構性資料;而Watson已經躍上雲端,成為從超級電腦到智慧型手機等各種裝置都能夠存取的服務。最終Watson的完整AI功能應該都能添加至CognizeR工具中,但第一版只會支援其語言翻譯、個性分析、聲調分析,以及語音/文字轉換、視覺辨識等演算法。

編譯:Judith Cheng

(參考原文: Watson for the Masses,by R. Colin Johnson)