AI藝術的前世今生
作者:馬立新(山東(dong) 師範大學美術學院教授,數字藝術哲學研究中心主任,博士生導師)
最近,全球刮起一股強勁的AI藝術風潮。究竟什麽(me) 是AI藝術?它是如何來到這個(ge) 世界的?又麵臨(lin) 著怎樣的機遇與(yu) 挑戰?
1、AI藝術關(guan) 鍵詞
AI藝術是指借助於(yu) 人工智能技術(artificial intelligence,簡稱AI)生成的藝術作品。它的範圍很廣,包括AI自主生成的作品和人機合作創作的作品,這些作品目前已經涵蓋繪畫、音樂(le) 、詩歌、電影、舞蹈、雕塑等領域。要了解這種新興(xing) 、新型的數字藝術,首先需要了解機器學習(xi) 、算法、神經網絡、深度學習(xi) 、生成對抗網絡和創新對抗網絡這幾個(ge) 重要概念。
人類借助於(yu) 感官和經驗來獲取知識,而機器學習(xi) 是指計算機係統學習(xi) 勝任某一專(zhuan) 門任務的路徑:一種是通過與(yu) 具體(ti) 任務完成情況相關(guan) 的獎懲機製來實現,這種機製稱為(wei) 強化學習(xi) ;一種是通過飼喂大量標記數據,首先掌握其中的邏輯,進而實現對相關(guan) 信息或事物的再現,這種機製稱為(wei) 監護學習(xi) 。例如飼喂一組猴子圖像讓計算機學習(xi) 識別猴子,當我們(men) 將一張照片放在它前麵的時候,計算機能精確地判斷這張照片是否與(yu) 猴子有關(guan) 。
算法即一個(ge) 按步驟執行的指令序列。它可以簡單到幾行代碼,也可能複雜得像一個(ge) 百度搜索結果那樣,需要上百萬(wan) 行才能顯示完全。這些指令告訴計算機做什麽(me) ,如何解決(jue) 問題,怎樣運算,如何在屏幕上展示事物等。
神經元是傳(chuan) 遞和處理感覺信息的人腦細胞。神經網絡則是特指一種計算機算法,它模仿人腦方式處理各種信息,包括多層互相聯結的神經元。神經網絡算法不同於(yu) 常規計算機編程算法,後者是編程者設計好的一係列供計算機執行的程序,而前者則是一種計算機自我決(jue) 策的運算機製,它不需要人類的任何指令。如卷積神經網絡就是一種能夠自主識別圖像上的某一特征或模式的神經網絡。
深度學習(xi) 指的是包含多層聯結神經元的神經網絡。它就像人腦一樣,包含的神經元層級越多,學習(xi) 能力就越強。
生成對抗網絡(GAN)指兩(liang) 個(ge) 神經網絡通過互相競爭(zheng) ,逐步實現一個(ge) 可預期的結果,其中一個(ge) 神經網絡試圖生成與(yu) 訓練數據不一樣的結果(通常被稱為(wei) 創造神經網絡),比如一張不同於(yu) 訓練圖像的新照片;另一個(ge) 神經網絡負責識別創造神經網絡生成的與(yu) 訓練數據差異很大的結果(通常被稱為(wei) 識別神經網絡),比如創造神經網絡預期是生成一張關(guan) 於(yu) 狗的新照片,如果輸出了一張貌似房子的圖像,識別神經網絡就將其篩選出來,並反饋給創造神經網絡,從(cong) 而確保其朝著預期的創作目標前進。
創新對抗網絡(CAN)以生成對抗網絡為(wei) 基本框架,但將一定的隨機性嵌入到創造神經網絡的結果中,再對這些結果加入適當的美學判斷訓練機製,以期生成更為(wei) 新穎和震撼的藝術作品。這顯然是模仿人類創造性的一種方式,目的是生成突破現有藝術風格和模式的藝術作品。
2、從(cong) 貝葉斯推理到AI藝術
當我們(men) 談論AI藝術淵藪的時候,就必須首先從(cong) AI的曆史談起。AI發生的先決(jue) 條件是獲得學習(xi) 和決(jue) 策的能力,特別是在信息不充分的情況下做出決(jue) 策的能力。為(wei) 此,托馬斯·貝葉斯於(yu) 1763年開發了一個(ge) 使用算數方法推算事物發生概率的框架,這就是著名的貝葉斯推理,它成為(wei) 機器學習(xi) 的基本邏輯,這是AI藝術進程中最早的一塊裏程碑。
1842年,數學家阿達·洛夫萊斯發表了第一個(ge) 可執行的算法。洛夫萊斯算法預見到計算機除了運算,還能解決(jue) 其他複雜的問題,這是一個(ge) 革命性的預見。百年之後,即1942年,圖靈為(wei) 智能機器的創造設計了測試指標,即著名的圖靈測驗,這是一種劃時代的思想。1943年,麥卡洛克和皮茨聯合發表了《人類神經活動中意識的邏輯運算》,為(wei) 計算機模仿人腦構建神經網絡和深度學習(xi) 鋪平了道路。1950年,科幻作家艾薩克·阿西莫夫創作了關(guan) 於(yu) 智能機器的一係列短篇小說,提出了著名的機器人三定律,他的這些頗具前瞻性的思想激發了整整一代機器人學家。在1956年的達特茅斯大學夏季會(hui) 議上,約翰·麥卡錫正式構建了“人工智能(AI)”概念。當時關(guan) 於(yu) AI編程機製存在兩(liang) 條路徑:一條是自上而下的,即用控製人類行為(wei) 的規則預先為(wei) 計算機編程;另一條主張自下而上,即模仿人類神經網絡機製。麥卡錫和資深計算機學家明斯基傾(qing) 向於(yu) 前者,並略占上風。1959年,阿瑟·塞繆爾提出了“機器學習(xi) ”的概念,根據這一概念,他預測一個(ge) 會(hui) 學習(xi) 的跳棋機器人有可能戰勝它的編程者,這一預言被後來的超級計算機“深藍”戰勝國際象棋冠軍(jun) 卡斯帕羅夫所證實。
對於(yu) AI藝術來說,1973年值得永遠銘記。這一年,加州大學教授兼畫家哈羅德·科恩在威尼斯雙年展上展示他與(yu) 自己的計算機程序“艾倫(lun) ”(AARON)合作創作的一幅繪畫,這標誌著AI藝術的正式誕生。
鑒於(yu) AI研發進展緩慢,羅德尼·布魯克斯認為(wei) 很可能過去采用的自上而下的研發路徑是錯誤的,他受到人類神經科學進展的啟發,1990年發表了著名論文《大象不下棋》,認為(wei) 視覺功能並不需要中央神經係統控製。他的這一構想也將一度不被看好的神經網絡推向前台,並極大地推動了包括AI藝術在內(nei) 的各個(ge) 人工智能領域的進展。
2008年9月,一款語音識別APP出現在蘋果手機上,它的語音識別正確率達到了92%以上,這是AI藝術發展中所取得的另一個(ge) 裏程碑式的躍進,它為(wei) 多模態大語言模型機器人的研發創造了條件。當學界和業(ye) 界都在熱衷於(yu) 開發優(you) 質算法的時候,在AI領域嶄露頭角的華人科學家李飛飛清醒地認識到,再好的算法如果沒有大量真實數據的支撐都不可能做出準確的決(jue) 策,於(yu) 是她提出了一個(ge) 史無前例的想法——構建圖像數據庫,將整個(ge) 世界都複現出來。她將自己領銜開發的這個(ge) 開源性質的巨型圖像數據庫定義(yi) 為(wei) ImageNet。自此以後,這個(ge) 數據庫成為(wei) 一線AI科學家競相檢驗算法精度的平台,它極大地加速了AI藝術的發展。
在2010年上海世界博覽會(hui) 上,一款跳舞機器人出現在人們(men) 的視野中,其翩翩舞姿引起眾(zhong) 人駐足觀看。2013年,英國金斯密斯學院教授西蒙·科爾頓開發了一款名為(wei) “傻子畫師”的繪畫程序,該程序能夠從(cong) 報紙上自主提取關(guan) 鍵詞,並生成與(yu) 該關(guan) 鍵詞相關(guan) 的圖像,顯現出超越圖靈測驗的創造性、靈巧性和想象力。2014年,即圖靈測驗發表72年之後,聊天機器人“尤金·古茨曼”最終通過了所有測試。2015年1月,莫德文采夫的藝術創作機器人“深夢”正式上線,自此之後,“深夢”成為(wei) 很多AI藝術家放飛藝術想象的絕佳平台。波普藝術家泰琳·薩頓上線“深夢”,於(yu) 2017年創作了首張AI音樂(le) 專(zhuan) 輯《我是AI》。一年之後,法國著名的藝術家三人聯盟機構“Obvious”利用神經網絡算法生成的藝術作品《埃德蒙德·貝拉米肖像》高價(jia) 拍賣成功,創造了AI藝術的新紀元。
3、AI藝術家先驅及其創作主題
數字技術的快速發展不僅(jin) 深刻地塑造著當下的經濟業(ye) 態,也推動數字藝術從(cong) 奇觀美學和互動美學時代迭代進入到AI美學新時代,並催生出一批在AI藝術領域勇於(yu) 探索和創新的藝術家。
馬裏奧·克林格曼就是活躍在這一領域的一位先驅人物。克林格曼於(yu) 1970年出生於(yu) 德國慕尼黑。他沒有任何藝術和計算機科學學術背景,但他天生就對計算機和藝術感興(xing) 趣。13歲的時候,他有了第一台計算機,自此開始,他無師自通,迷上了編程。高中畢業(ye) 後,他進入了廣告行業(ye) 。1991到1992年期間,克林格曼獲得一個(ge) 到總部在倫(lun) 敦的廣告公司實習(xi) 的機會(hui) ,在那裏,他第一次接觸到蘋果電腦和專(zhuan) 業(ye) 繪圖軟件Photoshop3.0,一個(ge) 成為(wei) AI藝術家的夢想由此誕生了。2004年,他使用JAVA語言編程創作了《垛狀模糊》。這是他最早的“計算機生成藝術”。2010年他編寫(xie) 了一款名為(wei) “蜘蛛絲(si) 畫板”的小程序,並試著用它創作了一幅同名繪畫。讓他始料未及的是這個(ge) 小程序竟然迅速獲得了一大批擁躉。從(cong) 2014年年底開始,他對各種算法、數據可視化處理和機器學習(xi) 技術開展了廣泛的探索,創作了多幅極富創意的作品。2017年以來,他又將最新的生成對抗網絡引入到自己的藝術實踐中,創作了大量以人臉和肖像為(wei) 標誌性形象的AI藝術作品。“當你麵對一個(ge) 人的麵部的時候,能夠解讀出極其豐(feng) 富的信息。”他對於(yu) 人性的這種獨特理解成為(wei) 他AI作品的一個(ge) 核心主題,而人臉也成為(wei) 他開展藝術實踐的肥沃土壤。
在將AI技術與(yu) 舞蹈藝術融合方麵,韋恩·麥克格雷格是一位始終走在前列的舞蹈家。他的《實時檔案》項目利用AI模型複現了他長達25年之久的舞蹈作品,借此在舞者和他的作品之間建構了一個(ge) 現場對話。AI模型對麥克格雷格的舞蹈風格,從(cong) 精致的細微動作到複雜的移位動作都能精準捕捉到。舞者能夠從(cong) 中獲得靈感,受到啟發,從(cong) 而創造出新的舞蹈動作。這正是麥克格雷格對AI技術最感興(xing) 趣的一點,他認為(wei) 持續地創造新穎別致的動作是舞蹈藝術的靈魂,而AI技術能夠幫助他實現這個(ge) 目標。
莎拉·梅約哈斯是一位橫跨電影、攝影、虛擬現實、表演和雕塑等多個(ge) 學科領域的AI藝術家。她最引人矚目的AI藝術作品是《雲(yun) 朵》。為(wei) 呈現這一作品,她在貝爾實驗室原址上主辦了一場大型表演。16個(ge) 攝影師拍攝了多達10萬(wan) 張不同角度的玫瑰花瓣照片,構成了一個(ge) 大型數據庫。這些信息旨在構建一個(ge) AI算法,用於(yu) 生成獨樹一幟的花瓣圖像。《雲(yun) 朵》的策展成為(wei) 一次思考後人類現實和未來人類勞動處境的絕佳機會(hui) 。梅約哈斯以AI技術為(wei) 武器,以藝術策展為(wei) 媒介,將AI藝術探索與(yu) 人類所麵臨(lin) 的重大現實主題緊密結合,引起了業(ye) 界和學界的廣泛關(guan) 注。
羅比·巴拉特是一顆正在AI藝術領域冉冉升起的新星,也是一位AI藝術奇才。他隻有19歲,卻以自己對於(yu) 神經網絡的深刻理解與(yu) 創造性應用,開拓了AI藝術和傳(chuan) 統藝術的視野。他與(yu) 法國畫家羅南·巴羅特和加萊裏·沃森三人(即上文提及的著名法國三人藝術聯盟Obvious)共同創作的頗具印象主義(yi) 風格的《埃德蒙德·貝拉米肖像》,創造了43.25萬(wan) 美元的拍賣高價(jia) ,此舉(ju) 也將AI藝術推向世界舞台。這一係列頗具創意的AI藝術探索也讓這位年輕人步入資深AI藝術家的行列。
在當下AI藝術創作領域,湯姆·懷特以其對於(yu) 人工智能和機器感知的深度研究和廣泛探索而聞名。他的一係列AI藝術實驗都聚焦於(yu) 機器凝視問題上——AI是如何觀察、如何理解和如何表達外部世界的?隨著機器感知越來越多地滲入我們(men) 的日常生活之中,這個(ge) 新世界正在變成我們(men) 不得不麵對的一個(ge) 主導領域,懷特正是用他的AI作品來透視和反思這種現象的。為(wei) 此,他創作了大量抽象作品,AI能夠對這些作品做出正確的分類。然後,他再賦予算法如同我們(men) 一樣的自然語言能力,如此一來,我們(men) 就能夠知道AI所理解的世界。懷特的這些探索深化了我們(men) 對於(yu) AI世界的理解。
4、AI的自主創作
AI藝術在發展中最常遭遇的一個(ge) 挑戰就是,如何從(cong) 其生成的巨量作品中挑選出相對而言最有趣味的作品,並將其引向普通社會(hui) 大眾(zhong) 。對於(yu) 幾乎所有AI藝術家來說,策展成為(wei) 他們(men) 應對這一挑戰的關(guan) 鍵一招。
AI藝術家也時常陷入這樣的兩(liang) 難選擇:作為(wei) 藝術家的他,總是不自覺地遵從(cong) 自己的口味來選擇作品,而作為(wei) 策展人的他,又總要考慮盡可能向觀眾(zhong) 展示AI藝術的全貌。究竟應該如何協調這種兩(liang) 難關(guan) 係?一般來說,作為(wei) 一個(ge) 策展人,他的理想是把他的AI模型放在現場,讓它持續地生成圖像,並訓練這台AI模型自己做出選擇;一旦AI模型從(cong) 中做出了選擇,它就會(hui) 自動消失。如此一來,這台AI模型本身就是藝術作品,而其中選出的那些圖像不過是它所創造的一些稍縱即逝的視覺印象。不過,現在的策展還不允許一個(ge) 藝術家如此超然,因為(wei) 就目前的AI模型來看,如果隻將它放在展覽現場,那麽(me) 觀眾(zhong) 所麵對的大多是噪聲,而且在此情況下生成的圖像大部分都是無趣的。
現實是殘酷的。如果AI藝術能夠繁榮發展,它就必須走向大眾(zhong) 。因此,在高雅與(yu) 通俗之間保持一定的平衡就是AI藝術的不二選擇,既不能離世俗太遠,也不能離它太近。這是大多數AI藝術家的看法。
基於(yu) 深度學習(xi) 的AI能否最終實現完全意義(yi) 上的自主創作?這是當下所有關(guan) 注AI藝術的人普遍關(guan) 心的問題。比如,對於(yu) 上文提及的賦予AI模型一定的策展能力和對作品的自我選擇能力,這難道不是某種AI自主性或主體(ti) 性的彰顯嗎?很多活躍在AI藝術一線的藝術家都在試圖通過自身的藝術實踐來回應這個(ge) 問題。克林格曼認為(wei) ,這個(ge) 問題從(cong) 某種程度上可以從(cong) 人類的傳(chuan) 宗接代邏輯來理解。我們(men) 生孩子是保障人類自身的繁衍和不朽。我們(men) 賦予AI一定的策展和選擇功能,本質上也可以視為(wei) 一種確保人類不朽的方式。例如,我們(men) 無法將自己上傳(chuan) 到計算機上,但我們(men) 可以創造某種事物,讓它能夠持續生產(chan) 我們(men) 想要的某種東(dong) 西,哪怕我們(men) 已經離世也不受影響。某種意義(yi) 上,賦能AI模型一定的策展能力就是一種讓藝術家持續延長藝術生命的方式。
另一方麵,通過賦予AI一定的策展和選擇能力,我們(men) 可以看看它究竟能夠做些什麽(me) ,又是如何去做的。從(cong) AI自身的角度看,它或許會(hui) 因為(wei) 這些能力而獲得一定的獨立性和自主性。克林格曼於(yu) 2018年創作的AI藝術《靈魂出竅》,就顯現出一抹自主性的陽光。在該程序中,他引入了一個(ge) 神經脈衝(chong) 機製,它可以通過隨機改變、刪除或交換被訓練的生成對抗網絡的成分,而引起神經網絡對於(yu) 輸入信息的誤讀,並因為(wei) 這種誤讀而創造出某種富有新意的藝術形象。
另一個(ge) 頗受爭(zheng) 議的問題是,AI能否對自己的藝術作品做出評價(jia) ?大多數AI藝術家都對此持樂(le) 觀態度。從(cong) 純粹技術角度看,AI總會(hui) 在某一天達到自我改進和提升算力、自我評價(jia) 作品質量的程度,但這也同時意味著,它將駛入一個(ge) 我們(men) 再也看不到的區域;它可以理解宇宙,也可以創作一個(ge) 屬於(yu) 自己的宇宙,但它也必須創造某種方式讓人類理解它的這些行為(wei) 。當然,它或許也會(hui) 在某一天,因為(wei) 我們(men) 跟不上它的速度,而最終對我們(men) 失去興(xing) 趣,但至少目前還不可能發生這些情況。為(wei) 解決(jue) 這些問題,AI科學家們(men) 正在研發某種人腦與(yu) 機器直接聯結的界麵或機製,以實現對AI理解的理解。
總的來說,活躍在AI創作一線的藝術家都對AI藝術的未來充滿信心。他們(men) 堅信,隨著人工智能、深度學習(xi) 、計算機算力算法和數據分析技術的快速發展,特別是隨著多模態大語言模型的突破性進展,在不久的將來,AI藝術家能夠創作出較之人類藝術家更有趣的藝術作品。而對於(yu) AI算力的快速提升可能引發的某些安全風險,我們(men) 也應提前做好各種應對準備。
版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。