新利平台 > 即時新聞 > 文化

Sora問世,一石驚起千層浪

發布時間:2024-03-12 15:36:00來源: 光明網

  作者:楊易臻 張宣 蔡姝雯

  “穿著時尚的女性漫步在霓虹燈閃爍的東(dong) 京街頭”“兩(liang) 艘海盜船在一杯咖啡內(nei) 作戰”……春節假期,這幾段畫麵精美的視頻在朋友圈“霸屏”,這些視頻是美國人工智能團隊OpenAI新發布的視頻大模型Sora創作的。

  Sora,這個(ge) 詞來源於(yu) 日語中的“天空”,意指無限的創造潛力。2022年底因發布ChatGPT一炮走紅的OpenAI,又因Sora在全球內(nei) 容創作領域掀起新的風暴。

  博采眾(zhong) 長,Sora“一騎絕塵”

  隻需要一段20至30個(ge) 詞匯的文本指令或一張靜態圖像,就可以生成一段視頻,不論是寫(xie) 實還是動畫風格、寬屏還是豎屏,皆可任意選擇。雖然Sora並非首個(ge) 可以通過文本生成視頻的大模型,但在時長、分辨率等視頻生成模型的關(guan) 鍵指標上,相比先前的Runway、Pika等文生視頻產(chan) 品,Sora可謂“一騎絕塵”。“Sora的誕生,意味著AGI(人工通用智能)的實現可能從(cong) 10年縮短至一兩(liang) 年。”360創始人周鴻禕在微博上宣布。

  記者親(qin) 身體(ti) 驗了此前某款視頻大模型的生成產(chan) 品,在生成的10秒視頻中,人物表情僵硬、動作不協調,視頻也無法準確呈現文字描述,與(yu) Sora的演示視頻相比,確實差距巨大。

  “Sora的技術亮點是,讓AI內(nei) 容編輯和生成實現了從(cong) 文本、圖像到視頻的本質跨越。”中國計算機學會(hui) 理事、南京理工大學計算機科學與(yu) 工程學院副院長肖亮認為(wei) ,Sora的底層技術並不算新,但優(you) 勢在於(yu) “博采眾(zhong) 長”,是多項技術積累、共同作用的結果。Sora在技術上的“顛覆性”主要體(ti) 現在三方麵:一是突破當前視覺大模型“60s超長視頻”生成瓶頸,以往的視頻模型大多隻能生成時長不超過10秒的視頻,而Sora在保證視頻時長的同時,還能保持人物和場景的連貫;二是呈現多角度一鏡到底,逼真表現光影幾何、物理關(guan) 係;三是較為(wei) 真實地遵循物理世界規律,比如畫筆會(hui) 在畫布上留下水墨、人吃漢堡會(hui) 留下咬痕等。

  OpenAI對Sora的定位頗具野心,號稱其並非僅(jin) 僅(jin) 是“文生視頻”的工具,而是一個(ge) 通用的“物理世界模擬器”——複現真實世界的重力、摩擦力等物理現象。這一定位使得Sora未來有望成為(wei) 跨越各行各業(ye) 的“超級工具”,可用於(yu) 模擬天氣變化、自動駕駛、生物行為(wei) 甚至軍(jun) 事場景等。

  對此,南京大學計算機科學與(yu) 技術係長聘副教授過潔表示,實際上,早有多條技術路徑瞄準“模擬物理世界”這一目標,隻不過實現方式不同。Sora的技術路徑可以理解為(wei) “數據驅動”——通過學習(xi) 視頻來理解現實世界的動態變化,並用計算機視覺技術模擬這些變化。“但從(cong) Sora的一些‘翻車’視頻可以看出,它在理解物理世界時會(hui) 遇到困難。”過潔以遊戲舉(ju) 例,在一款射擊遊戲中,玩家想要走出屋子射擊“敵人”,Sora很可能會(hui) 讓玩家“穿牆而去”。“Sora是否知道牆是一道物理障礙?在它塑造的世界規則中,是否有這麽(me) 一條規矩,規定牆是不能穿過的?這些都是未知。”

  “目前Sora接受的所有訓練都是人類‘喂’給它的,其實還是沒有跳脫現階段人類的認知範圍。目前還有許多物理規律連人類都還沒有掌握,人類尚未踏足的知識領域,Sora也無法理解。”過潔說。

  創意工作,AI仍難以替代人類

  “過往的人工智能產(chan) 品,多半可以分為(wei) ‘以文生文’‘以文生圖’等類型。它們(men) 大多是根據網上已有的語料來進行內(nei) 容產(chan) 出,對於(yu) 我們(men) 的工作生活並沒有帶來特別大的改變。”南京大學人工智能學院院長周誌華分析,大家之所以對“文生視頻”的反應“有點大”,是因為(wei) 通過文字輸入來生成視頻這種方式,更容易讓大家感同身受。

  影視娛樂(le) 行業(ye) 的內(nei) 容創作者,成為(wei) 最早擁抱AI創作工具的探路人之一。國內(nei) 一家頭部影視公司的AI項目負責人王鈺媛告訴記者,自2022年5月“文生圖”工具Midjourney推出測試版本,她便開始探索AI為(wei) 內(nei) 容創作帶來的可能性。“AI目前在影視全流程都有所應用,涵蓋前期開發、中期製作、後期宣發整個(ge) 鏈條。在影視項目的前期開發中,AI可以協助頭腦風暴,激發‘腦洞’,還可以輔助背景調研、製作策劃書(shu) 、潤色大綱、評估IP等。比如,在動畫電影的角色設計過程中,需要完成角色的配色、服裝、整體(ti) 的線稿等,傳(chuan) 統情況下,美術設計師要用三四天時間才能完成,如果導演不滿意,還需要好幾輪溝通和修改,而利用AI,能迅速生成很多案例給導演和製片方選擇,減少了大量溝通成本。”

  3月6日,一部自稱“完全由AI製作的開創性長篇電影”在洛杉磯首映。這部《終結者2》的翻拍作品,由50位藝術家組成的團隊完成。該團隊使用Midjourney、Runway、Pika等多個(ge) AI工具進行創作。結合過往的使用經驗,王鈺媛認為(wei) ,就整體(ti) 質量而言,目前AI生成的內(nei) 容離商業(ye) 質量要求還很遠。比如,控製影片特定畫麵的風格、色調,保持角色的一致性,製作連貫的長鏡頭,都是AI目前難以完成的。AI工具更偏向於(yu) 輔助、提供靈感和參考,沒有辦法完全取代某一個(ge) 環節。

  “不過,大模型確實有可能顛覆傳(chuan) 統電影的商業(ye) 模式。傳(chuan) 統的影視製作,需要編劇、導演、製作團隊、演員等共同協作,工種細分程度很高。”王鈺媛說,近幾年興(xing) 起的短視頻中,遵循“黃金三秒定律”的短視頻,無需在製作上多麽(me) 精良,但對視頻創意的要求很高,需要立刻抓住觀眾(zhong) 眼球。對於(yu) 這些短視頻創作者,AI就可以成為(wei) 很好的輔助。

  在未來的“眼球爭(zheng) 奪戰”中,拚創意將成為(wei) 趨勢。“曾經一個(ge) 專(zhuan) 業(ye) 團隊才能製作出的影片,現在有可能一個(ge) 人就能完成。不需要商業(ye) 融資、不需要花大價(jia) 錢請演員、攝影師,人人都可以成為(wei) 創作者。”王鈺媛推測,AI將給觀眾(zhong) 帶來更多可選擇的娛樂(le) 產(chan) 品,除了電影、電視劇,短視頻、遊戲等更多節奏緊湊、領域細分的內(nei) 容和產(chan) 品將呈現爆發式增長。“我認為(wei) AI工具衝(chong) 擊的不是某個(ge) 具體(ti) 的工種,而是傳(chuan) 統行業(ye) 或者帶有固定思維的人群。”

  新浪潮來襲,教育何為(wei) ?

  “盡管國內(nei) 大模型產(chan) 品如雨後春筍大量湧現,但實際發展還是與(yu) 美國存在差距。”業(ye) 內(nei) 人士表示,究其原因,在於(yu) 算力、數據和人才三個(ge) 方麵。

  當下,人工智能已成為(wei) 產(chan) 業(ye) 創新的關(guan) 鍵抓手之一。省政府工作報告也指出,要更大力度發展數字經濟,以人工智能全方位賦能新型工業(ye) 化,積極構建特色化行業(ye) 大模型,打造人工智能創新應用先導區。

  “江蘇發展人工智能大模型的一大優(you) 勢是高校資源非常充分,但江蘇各個(ge) 高校培養(yang) 的頂尖人才外溢現象比較明顯。”過潔說。

  2月27日,南京大學宣布,將於(yu) 今年9月麵向全體(ti) 本科新生開設“人工智能通識核心課程體(ti) 係”。課程體(ti) 係將涵蓋1門必修的人工智能通識核心課,搭配人工智能素養(yang) 課,以及各學科與(yu) 人工智能深度融合的前沿拓展課,從(cong) 知識、能力、價(jia) 值觀與(yu) 倫(lun) 理三個(ge) 維度開展教育教學。

  “近幾年國內(nei) 許多高校都建立了人工智能學院,從(cong) 本科開始專(zhuan) 門培養(yang) 人工智能專(zhuan) 業(ye) 人才,這是一個(ge) 好開端。”周誌華表示。南京大學2018年成立我國C9高校中第一個(ge) 人工智能學院培養(yang) 本科生,並率先發布我國第一個(ge) 人工智能本科專(zhuan) 業(ye) 教育培養(yang) 體(ti) 係。

  “從(cong) 人工智能領域的發展來看,重要的是打通‘基礎研究—人才培養(yang) —創新技術—產(chan) 業(ye) 發展’的通道。”周誌華說,“基礎研究水平提高了,國內(nei) 大批研究生能夠接觸和從(cong) 事與(yu) 國際接軌的研究課題。其中一些學生自然會(hui) 走到前沿促進基礎研究和技術創新,他們(men) 將成為(wei) 我國人工智能產(chan) 業(ye) 蓬勃發展的生力軍(jun) 。”(楊易臻 張宣 蔡姝雯)

(責編:常邦麗)

版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。