新利平台 > 即時新聞 > 國內

人工智能,如何妙筆“生”畫

發布時間:2022-12-23 15:28:00來源: 人民日報

  核心閱讀

  輸入一段話,“繪”出一幅畫——人工智能的繪畫本領,吸引眾(zhong) 多職業(ye) 畫師和零基礎用戶嚐鮮。人工智能繪畫的本質是計算,接受“語言描述”指令後根據自身的理解還原出圖像。未來,人工智能技術應用於(yu) 藝術創作等領域,還要注意防範潛在風險,讓技術進步更好地造福社會(hui) 。

  不用畫筆、顏料,輸入一段描述性文字,計算機就能自動解析,生成相應的畫作。2022世界人工智能大會(hui) 上,人工智能繪畫的展示令觀眾(zhong) 驚歎。

  一些過去專(zhuan) 屬於(yu) 人類創作的領域,比如繪畫、書(shu) 法、寫(xie) 作、作曲,如今人工智能也已開始涉足。人工智能是如何繪畫的?當前沿技術與(yu) 藝術相遇,將碰撞出怎樣的火花?在內(nei) 容、版權等方麵又是否存在問題?

  從(cong) 文本到圖像,人工智能繪畫本質是計算

  人工智能繪畫是一個(ge) 從(cong) 文本到圖像的生成過程,輸入一段話,生成一幅畫,本質是計算。簡要地說,計算機通過大量學習(xi) ,能識別特定圖片元素和文本之間的關(guan) 聯。同理,人工智能程序在收到“語言描述”指令後,可以根據自身的算法還原出圖像。

  設定計算機程序作畫的想法由來已久。早在20世紀70年代,就有藝術家開發了操作機械臂的電腦程序,讓機械臂按照指令在畫紙上作畫。近些年,人工智能技術日新月異,科研人員嚐試設計自動作圖的計算機程序。但過去很長一段時間,人工智能“畫”出的作品普遍不夠好,往往隻是一些模糊的圖像元素的組合,還稱不上是完整的畫。

  今年以來,人工智能畫技迅速“進化”。談及技術突破原因,百度文心一格總架構師肖欣延認為(wei) ,這是預訓練大模型的興(xing) 起、大數據的訓練和擴散模型的出現3方麵共同作用的結果。

  具體(ti) 來說,預訓練大模型增強了人工智能的通用性,成為(wei) 人工智能技術及應用的新基座;大數據的訓練中,通過在眾(zhong) 多高性能GPU(圖形處理器)算力資源中進行並行學習(xi) ,計算機能夠在短時間內(nei) 完成大量的數據學習(xi) 。近年來,幾乎所有人工智能的技術發展都受益於(yu) 這兩(liang) 方麵的進展。而對人工智能繪畫來說,擴散模型的出現至關(guan) 重要。

  擴散模型的原理是,通過人為(wei) 逐步添加噪聲,讓圖像逐漸變“模糊”,再不斷學習(xi) 去噪過程,如此人工智能就能從(cong) 完全是噪聲的圖片中逐漸還原出清晰的圖片,即“畫”出圖像。

  “這一過程與(yu) 人類學習(xi) 相似。通常,人們(men) 學畫從(cong) 臨(lin) 摹開始,機器也是如此。它最初生成的圖像可能很模糊,但計算機會(hui) 不斷修正,從(cong) 而輸出越來越清楚、層次越來越豐(feng) 富的圖像。”肖欣延說。

  擴散模型讓人工智能繪畫技術實現跨越,不僅(jin) 作畫質量快速提升,生成時間也縮短到幾秒鍾。

  眾(zhong) 多用戶嚐鮮,大量應用加速“畫技”進化

  湯林傑是某互聯網公司的運營人員。工作中,他需要借助一些圖片來豐(feng) 富文案,而網絡上找到合適的配圖並不容易。今年10月,了解人工智能繪畫程序後,他嚐試自己“畫”圖。現在,人工智能繪畫工具已經是他工作的重要輔助。

  隨著算法模型對公眾(zhong) 開放以及訓練數據成本的下降,人工智能繪畫門檻越來越低,一些簡易化操作平台在國內(nei) 外興(xing) 起。如今,不僅(jin) 一些職業(ye) 插畫師嚐試用人工智能繪畫程序輔助作畫、激發靈感,許多沒有繪畫基礎的用戶也開始嚐鮮,並“曬”在社交平台上。

  大量需求的湧現也加速了技術的更新迭代。“用人工智能繪畫的人越多,算法就越能理解輸入的描述文本,畫作質量就越高。”肖欣延表示,當前人工智能繪畫水平與(yu) 今年初相比,已經有很大進步。

  不過,目前的人工智能繪畫技術並不完美。首先,可控性仍然不高,即計算機不能很好理解人類指令的含義(yi) ,即便是輸入“畫兩(liang) 個(ge) 蘋果,左邊紅色,右邊綠色”這樣的簡單描述,生成的圖像也可能有很大偏差;其次,細節呈現能力還不夠。比如,對空間、透視和光影的刻畫就很不如意。不少人工智能渲染出的畫作,初看上去驚豔,認真觀察問題卻不少。

  但肖欣延認為(wei) ,人工智能繪畫在技法上的缺陷未來有望得到彌補。比如,基於(yu) 跨模態大模型和強大的深度學習(xi) 框架,百度開發的技術一定程度上已經緩解這些問題。此外,未來人工智能不僅(jin) 能作畫,還能根據文本描述生成視頻,並直接配上解說文字,“可以把視頻生成看作是維度更高的繪畫,從(cong) 技術層麵看,這是可以實現的。”

  防範潛在風險,守住法律和倫(lun) 理底線

  人工智能進入繪畫領域,計算機會(hui) 取代人類畫師嗎?

  在肖欣延看來,好的繪畫與(yu) 構圖、設計語言、視覺情緒息息相關(guan) ,即使人人都可以用人工智能技術作畫,但通常隻有高水平的畫師才能製作出優(you) 秀的人工智能繪畫作品,“人工智能隻是作畫的輔助工具”。此外,雖然有的人工智能繪畫語言嫻熟,也包含細膩的情感,但並不意味著機器有意識、情感,它不過是學過類似的作品,又恰好呈現出來了。“優(you) 秀的藝術作品往往是人的思想的投射,目前機器並沒有真正具備思考能力。”肖欣延說。

  不少業(ye) 內(nei) 人士認為(wei) ,不妨以開放的心態擁抱人工智能繪畫,接受新事物。可以預想,將來繪畫中一些繁瑣、重複性的工作可能由計算機完成,創作者能騰出更多時間去構思想法與(yu) 創意,調整構圖、色彩、光影氛圍等。

  “人工智能可能會(hui) 激發繪畫創造的活力。”肖欣延表示,20世紀前後,照相技術讓傳(chuan) 統肖像畫失去市場,促使一些畫家向非寫(xie) 實方向創新。與(yu) 人工智能技術融合,或許能激發畫家創作出別開生麵的作品。

  不過,由於(yu) 人工智能繪畫發展剛剛起步,技術發展也引發關(guan) 於(yu) 版權、內(nei) 容把控等問題的爭(zheng) 議。比如,有人認為(wei) ,未經授權人工智能畫作模仿原畫的內(nei) 容、構圖和風格等,侵犯了原作者的版權,有違法嫌疑。也有人認為(wei) ,“機器學習(xi) ”過程是一種類人化的創作行為(wei) ,同樣體(ti) 現了創造者的思想和勞動,應當獲得版權保護。此外,還有人擔憂,人工智能繪畫技術若被濫用,可能滋生暴力等令人不適的圖像。麵對新技術發展,有必要前瞻潛在的風險,隻有守住法律和倫(lun) 理底線,技術進步才能更好地造福社會(hui) 。

  不隻是繪畫,寫(xie) 作、作曲、生成短片,人工智能日益強大的深度學習(xi) 能力,讓它與(yu) 不同藝術門類發生著奇妙的碰撞。展望未來,業(ye) 界專(zhuan) 家認為(wei) ,人工智能與(yu) 藝術融合,一方麵會(hui) 降低一些藝術門類的創造門檻,讓更多人參與(yu) 到當代的審美創造中來;另一方麵新技術會(hui) 帶來新的審美風格,人們(men) 或許能從(cong) 中擴展對自身和世界的認識。

  本報記者 喻思南

(責編:陳濛濛)

版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。