新利平台 > 即時新聞 > 博覽

人人拍出自己滿意的影視劇,Sora也不行?

袁秀月 發布時間:2024-02-23 09:11:00來源: 中國新聞網

  中新網北京2月22日電(記者 袁秀月)“給它讀一遍《三國演義(yi) 》試試”“《三體(ti) 》可以直接小說轉電影了”……近日OpenAI發布首個(ge) 文生視頻模型Sora,在網上迅速刷屏,不少網友躍躍欲試,期待將來用AI還原小說中的場景。

  還有人預測,以後人人都能拍出自己滿意的影視劇了。將來這會(hui) 實現嗎?或者說,離實現這點還有多遠?

  把小說輸進AI,然後呢?

  在談論Sora之前,不得不提到,當前很多影視遊戲行業(ye) 人士已經將AIGC(人工智能生成內(nei) 容)應用於(yu) 內(nei) 容製作上。

  來自四川的博主馮(feng) 先生(“AI瘋人院”)在CG領域工作了15年,從(cong) 事過影視特效後期、遊戲研發等。他表示,現在影視行業(ye) 正廣泛接納AI的進入,目前主要應用於(yu) 影視前期的概念設計、舞台設計等,一些動畫團隊、遊戲開發公司也正布局或引入AI生產(chan) 線。

  馮(feng) 先生最近在短視頻平台發布了多條《西遊記》係列AI概念動畫,獲得了近百萬(wan) 的播放量。他告訴記者,他使用的工具是AI繪畫工具Midjourney和AI視頻生成工具Runway。

  “每個(ge) 鏡頭要先構思好,然後通過Midjourney畫出畫麵,一個(ge) 鏡頭可能要畫上千張,最後選出一張,‘猴王問世’那集我畫了三四千張,最後選出一百個(ge) 左右鏡頭,再把這些鏡頭拿給AI工具生成動畫,然後進行剪輯。台詞先設計好,用AI配音來配,有些特殊的我會(hui) 自己配音,再用變聲器調整效果。”

  馮(feng) 先生說,用AI製作這樣一段視頻需花費一周左右,但若人工製作可能需要幾個(ge) 月。他表示,一般做動畫,需要概念設計、原畫、2D逐幀分鏡、3D場景搭建等流程,但如果有AI輔助的話,隻需有原畫,AI就會(hui) 幫你出畫麵並生成動畫效果,中間過程會(hui) 省去很多。

  而Sora的問世或將這個(ge) 過程省去更多。在馮(feng) 先生看來,Sora能夠在一個(ge) 畫麵裏生成多個(ge) 鏡頭,這是他以往使用的工具做不到的,這也就意味著將來能創作出更流暢、完整的作品。

  那麽(me) ,把小說輸進去,能得到滿意的視頻嗎?馮(feng) 先生認為(wei) ,還需要一個(ge) 過程,快的話可能等個(ge) 三四年。“其實技術上的都不是難題,難在人類能夠理解各個(ge) 不同國家的文學作品,了解它的背景和不同的文化元素,但AI還沒有很好理解這些東(dong) 西。”

  馮(feng) 先生提到,在他用AI工具創作的過程中,能夠明顯感覺到它對不同文化的了解並不透徹,比如說中國文化,看起來風格相像,但仔細看衣服的紋飾和盔甲的造型並不真實存在。

  不過他也表示,AI的學習(xi) 是呈指數級增長的,從(cong) 畫麵抽象到能理解畫麵的豐(feng) 富性和風格,僅(jin) 迭代了一年多時間。Sora確實存在瑕疵,但這隻是AI的迭代過程,在未來不是什麽(me) 大事。

  Sora問世,人人成為(wei) 導演?

  雖然目前Sora還未對公眾(zhong) 開放,但不少人認為(wei) 其意義(yi) 不亞(ya) 於(yu) 1年前ChatGPT的發布。從(cong) 技術角度來講,Sora強在哪裏?

  北京師範大學教育學部副教授張進寶表示,Sora采用了擴散模型和Transformer架構的結合(Diffusion Transformers, DiTs)。擴散模型通過逐漸添加噪聲來破壞圖像,然後學習(xi) 逆向過程來恢複圖像。Transformer架構則可以捕捉圖像中的全局依賴關(guan) 係。

  Sora的生成過程可以分為(wei) 以下幾個(ge) 步驟:將文本描述轉換為(wei) 一係列的語義(yi) 向量;將語義(yi) 向量輸入到模型中,生成視頻的潛在表示;將潛在表示解碼為(wei) 像素,生成最終的視頻。

  張進寶說,目前我們(men) 看到的是Sora使用了大量的視頻和圖像數據集進行訓練,包括電影、電視劇、紀錄片、遊戲畫麵等。這些數據集涵蓋了各種場景、人物和動作,為(wei) 模型提供了豐(feng) 富的學習(xi) 素材。

  在他看來,Sora的誕生不僅(jin) 標誌著視頻生成技術的重大進步,也為(wei) 內(nei) 容創作、媒體(ti) 、娛樂(le) 等行業(ye) 帶來了前所未有的機遇和挑戰。例如:Sora的出現預示著視頻生成領域的競爭(zheng) 將變得更為(wei) 激烈,推動多模態AI以及各種AI應用場景的快速發展,特別是在需要真實世界建模的行業(ye) 。與(yu) 傳(chuan) 統的影視製作相比,使用Sora的生產(chan) 過程更簡單,投資成本更低,創意結果更快速。

  張進寶認為(wei) ,Sora讓創作者可以更自由地使用AI工具表達自己的想法,減少了工業(ye) 流程的約束,為(wei) 內(nei) 容創作提供了新的視角和工具。雖然目前Sora還無法完全取代傳(chuan) 統的影視製作,但其強大的能力表明,依靠AI輔助人類創造力的方向越來越明確,這可能會(hui) 重新定義(yi) 影視內(nei) 容的創作和消費方式。

  “這也是AI引起那麽(me) 多討論的原因之一,會(hui) 給大家帶來壓力,其實我身邊的從(cong) 業(ye) 者基本沒受到影響,如果你是一個(ge) 成熟有經驗的美術或特效,並不會(hui) 受到太大影響,它會(hui) 成為(wei) 你的一個(ge) 輔助工具。”馮(feng) 先生認為(wei) ,即便有AI,人人成為(wei) 導演也不現實,最後還是掌握在少數專(zhuan) 業(ye) 人的手裏。

  中國影協科幻電影工作委員會(hui) 執行秘書(shu) 長馬賀亮在接受媒體(ti) 采訪時也表示,短期內(nei) 與(yu) 概念設計、視頻預覽相關(guan) 的崗位會(hui) 在一定程度上受到Sora的影響,但它所能呈現的效果其實還達不到院線電影的級別,而且電影在創作上有主觀立場、視角和表達,觀看時有情感交流和情感投射,遠不是簡單生成一段視頻就能代替,因此AI作為(wei) 技術輔助手段的確已經在改變電影製作方式與(yu) 流程,能優(you) 化提升電影創作,但要說它能“顛覆整個(ge) 電影行業(ye) ”,還為(wei) 時過早。

  AI還有哪些可能性?

  “潘多拉的盒子既然已經打開,指望它關(guan) 上太不現實了。”在馮(feng) 先生看來,除了繪畫、做視頻、文案等,AI還有更大的發展空間。

  “Sora模型所展示出的能力,可以讓人們(men) 進一步暢想更多的應用可能,為(wei) 各個(ge) 領域帶來新的變革和創新。”張進寶舉(ju) 例,比如在教育領域中,可用於(yu) 製作個(ge) 性化的教學視頻,模擬實驗和場景,用於(yu) 創建虛擬課堂,提供更加便捷的教育資源。

  在醫療領域,可用於(yu) 製作醫學動畫,幫助醫生和患者更好地理解病情;模擬手術過程,幫助醫生進行術前規劃和訓練;進行遠程醫療,為(wei) 偏遠地區患者提供便捷的醫療服務。在科研領域,可用於(yu) 模擬科學實驗,生成科學數據可視化,構建虛擬世界,用於(yu) 科學研究和探索。在商業(ye) 領域,可用於(yu) 製作產(chan) 品宣傳(chuan) 視頻、創建虛擬展廳,用於(yu) 市場調查和分析,幫助企業(ye) 更好地了解客戶需求,等等。

  與(yu) 此同時,Sora可能帶來的風險也備受關(guan) 注,比如可能被用於(yu) 造假或欺騙,Sora生成的內(nei) 容可能存在偏見或錯誤,等等。法律界人士認為(wei) ,隨著AI技術的發展,法律上的監管也需要跟上。服務者或提供者在算法設計、訓練數據選擇、模型生成和優(you) 化、提供服務等過程中,也需要采取有效措施防止產(chan) 生各類歧視,同時避免製作、複製、發布、傳(chuan) 播虛假信息。

  在張進寶看來,智能化將全麵滲透人類社會(hui) ,人們(men) 將在廣泛使用各類智能技術提升競爭(zheng) 力與(yu) 完成任務的過程中,學會(hui) 理解技術、捕捉新興(xing) 技術的潛力,推動社會(hui) 有秩序的動態發展。“捕捉科技發展新動態,在可控範圍內(nei) 做出正確的決(jue) 策,考驗的不僅(jin) 僅(jin) 是一個(ge) 人,而是整個(ge) 社會(hui) 的應變能力。”(完)

(責編: 王東)

版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。