在9月底於英國倫敦舉行的深度學習高峰會(Deep Learning Summit)上,DeepMind (EETT編按:該公司現隸屬於Google母公司Alphabet)的研究科學家Ali Eslami介紹了一個非常有趣的專案,名為「人工智慧與創造力」(Artificial Intelligence and Creativity)。

Eslami在DeepMind的團隊設置了一個AI代理(agent,一個會採取某種行動的神經網路),以繪製人臉作為挑戰,在一台電腦安裝繪圖程式(Mypaint),讓它能試驗各種變量,例如選擇筆刷、放置(placement)、線壓(line pressure)以及顏色等。該AI代理被饋入未標記的人臉照片訓練資料集,而結果是令人驚訝的逼真。

20191014_AIdraw_NT01P1

以未標記人臉照片訓練的AI代理所繪製出的人臉。
(來源:DeepMind)

Eslami的團隊是利用了強化學習(reinforcement learning)技術。今日大多數的AI系統是採用監督式學習(supervised learning),所饋入的資料是以某種方式標記過的,因此系統能將結果與標準答案進行比對;相反的,非監督式學習則是饋入未標記的訓練資料,讓系統嘗試以自己的方式去辨別特徵。

強化學習就是某種形式的非監督式學習,在訓練過程中,有被稱為鑑別器(discriminator)的第二個AI代理對結果提供回饋,好讓負責創造的AI代理去學習。在產生影像的情境中,該鑑別器可能會比較產出的影像與訓練資料,然後針對是否能辨別出差異提供回饋,這種回饋可能是一種分數,以量化辨別所產生影像與訓練資料集之間差異的困難程度。

20191014_AIdraw_NT01P2

強化學習採用兩個AI代理,其一負責創造影像,另一個則嘗試分辨創造出的影像與實際資料之間像不像。
(來源:DeepMind)

在DeepMind教導其AI系統如何畫圖之前,他們已經教過該系統如何寫字──去年該AI系統一開始接受的訓練是各種英文字母的手寫字與字體的影像(採用MNIST與Omniglot資料集),而且系統非常成功地重現了那些字母。

DeepMind團隊還很驚訝地發現,若限制筆劃數,所產出的結果就很像是人類在匆忙中寫出的字跡,點與較小的特徵會連在一起;該公司團隊還將演算法與拿著畫筆的機器手臂連線,以產生手寫書法。

一旦該AI系統能應付手寫字,Eslami的團隊就讓系統升級以應用更大的網路,並採用更多CPU進行訓練。當採用人臉照片做為訓練資料集,AI系統繪製出的畫像會變得越來越逼真,如下圖所示的繪畫過程各個階段。

20191014_AIdraw_NT01P3

AI系統繪製人臉畫像的過程。
(來源:DeepMind)

請注意,該AI系統並沒有被提供目標影像,只是創造它認為看起來像人臉的畫像,而且電腦並沒有看過人類是如何繪圖,只是藉由強化學習的嘗試錯誤過程去探索關於繪畫的一切。Eslami表示,這裡實際上有兩個複雜的任務,其一是以高精準度控制筆刷,其二是管理時間,在過程中權衡其畫像結果要看起來有多逼真。

接下來該團隊所做的事情是自問:如果我們讓任務變得更困難呢?於是他們將筆劃的數量限制從1,000減少到20,而讓他們驚訝的是,該AI代理仍然能產生雖然更抽象、但看得出是人臉的畫像。

20191014_AIdraw_NT01P4

不同超參數(hyperparameters)下的不同AI代理所繪製的人臉「抽象畫」樣本。
(來源:DeepMind)

而Eslami表示,那些抽象畫最讓人震驚的是,該AI代理已經能清楚辨識構成人臉特徵的重點──即眼睛、鼻子與嘴巴;他們原本認為AI系統只能透過模仿或是以監督式學習被教導這些抽象畫,但強化學習確實也可能達成。

所以AI已經成功學會畫圖了..但這是一種創造力嗎?或者只是隨機結果?還有這能算是藝術嗎?你可能會爭辯,AI代理是利用創造力去嘗試以不同的方法呈現人臉,如上面圖片中的畫像,即使它們看起來都像人臉,其中的差異性還是比相似性更多。

不過事實是,AI系統的意圖並不在於將人臉抽象到繪畫的最基本元素中,也不是要產生能喚起情感反應的畫像,其目標是在於寫實,是以畫像看起來有多麼逼真來評判其成功與否。

此外也會有人爭議,AI系統繪製的畫像是以高水準的技巧完成,所以這代表AI是有成就的藝術家了嗎?當訓練過程結束,該系統肯定能產出更好的畫像,甚至學著從模糊的筆觸開始,在最後添加更犀利的線條;可惜的是,今日對於何為藝術並沒有嚴格的定義,也許這個問題的答案應該由觀眾們來決定。

編譯:Judith Cheng

(參考原文: Can an AI Learn to Draw?,by Sally Ward-Foxton)