新利平台 > 即時新聞 > 文化

Sora來了,我們該如何應對

發布時間:2024-02-27 16:14:00來源: 中國青年報

  機器越來越像人一樣思考並不可怕,可怕的是人會(hui) 像機器那樣去思考。算法技術的發展打破了人們(men) 之間智力的圍牆,但也會(hui) 形成對人的個(ge) 體(ti) 價(jia) 值的蔑視、貶低與(yu) 馴化。“人們(men) 如何去形成自己個(ge) 性的生存之地是首要問題。 ”在技術不斷革新的情況下,人們(men) 更需要知道技術是幹什麽(me) 的、如何適用於(yu) 市場、怎麽(me) 進行技術的產(chan) 品化。

  ——————————

  過去複雜的視頻製作過程,對Sora來說隻是簡單幾句話的事。

  OpenAI發布Sora模型幾天後,360創始人周鴻禕表示,“AGI(通用人工智能)的實現將從(cong) 10年縮短至兩(liang) 三年”;國內(nei) 視頻生成軟件Pika創始人郭文景,開始籌備對標Sora的新產(chan) 品;Stability AI CEO埃馬德·莫斯塔克不由得讚歎道,“阿爾特曼(OpenAI 首席執行官)真是一個(ge) 魔術師”。

  Sora強在哪

  根據OpenAI的官方簡介,Sora可以製作長達60秒的視頻,視頻包括高清晰度的場景、複雜的鏡頭動作,並可支持多個(ge) 角色的創作,是基於(yu) ChatGPT和靜止圖像生成器DALL-E所建立的視頻生成模型。

  視頻生成模型,並不是今年的新應用。早在去年4月,紐約一家名為(wei) Runway AI的初創公司推出了這項技術,人們(men) 隻需在電腦屏幕上的框中輸入一句話,即可生成視頻,比如無人機航拍的山脈或者一個(ge) 男人晚上走在紐約市中心的街頭。

  但Runaway AI的生成視頻僅(jin) 有4秒,視頻模糊、斷斷續續、人物四肢扭曲。

  僅(jin) 僅(jin) 10個(ge) 月後,OpenAI公司的Sora就解決(jue) 了這一技術難題。該公司在Sora的官方介紹中稱:“該模型不僅(jin) 了解用戶在提示中提出的要求,還了解事物在物理世界中的存在方式。”

  比如,當幾隻巨大的毛茸茸的猛獁象在白雪皚皚的草地上奔跑時,猛獁象踏過的雪地隨之揚起巨大的雪浪,一個(ge) 毛茸茸的小怪物跪在融化的紅蠟燭旁邊時,蠟燭隨之慢慢減少,變成蠟油。

  談到Sora最大的優(you) 勢,周鴻禕日前在社交網絡上分享指出,以往文字視頻軟件都是在2D平麵上對圖形元素進行操作,可以把視頻看成多個(ge) 真實圖片的組合,並沒有真正掌握這個(ge) 世界的知識。但Sora產(chan) 生的視頻裏,它能像人一樣理解坦克是有巨大衝(chong) 擊力的,坦克能撞毀汽車,而不會(hui) 出現汽車撞毀坦克這樣的情況。

  不過,Sora仍有缺陷。OpenAI公司公開表示,Sora是一項正在進行的工作,當涉及到現實世界中的空間細節和因果關(guan) 係時,它可能具有明顯“弱點”。

  比如,在OpenAI公布的演示視頻中,一個(ge) 在跑步機上反向跑步的人,手腳動作節奏並不合理。再者,當一群幼狼在碎石路上嬉戲玩耍,幼狼的數量會(hui) 憑空增加和減少;當一位壽星老人在生日吹蠟燭時,蠟燭在吹氣後毫無反應。

  “Sora並不能替代抖音、快手等短視頻社交平台”

  即使技術並未真正成熟,Sora的橫空出世仍在技術圈、影視圈,乃至全球互聯網引發了一定程度上的“AI焦慮”。

  有網友聲稱,抖音、快手等短視頻平台要被“團滅”了;還有人說,明星和導演即將被取代;影視與(yu) 廣告製作的相關(guan) 從(cong) 業(ye) 人員似乎也感受到前所未有的職業(ye) 危機。

  但與(yu) 那些感到焦慮的從(cong) 業(ye) 人員不同,從(cong) 事編劇工作七年之久、深耕抖音短視頻賽道的劉宇陽對Sora的出現感到興(xing) 奮。在他看來,製作傳(chuan) 統影片涉及到的選址、選演員、分鏡構圖、架設機位、後期製作等複雜流程將被Sora簡化,降低了影視製作的周期與(yu) 成本。

  他認為(wei) ,Sora將減輕編劇的工作負擔,提高編劇的獨立性和自主性。“一直以來,編劇在影視製作過程中都處於(yu) 弱勢地位。”原來編劇在完成完整劇本前,需要拿著相關(guan) 策劃方案、劇情框架乃至已經初步完成的劇本和導演、資方進行項目溝通。

  劉宇陽解釋說,一個(ge) 影視項目常常牽涉多方利益,開拍前的溝通工作費時且效率低。“以後用Sora,分鏡鏡頭、樣片都可以直接生成,我們(men) 可能還有獨立製作影片的機會(hui) ”。

  盡管如此,他認為(wei) Sora無法真正替代演員和導演,獨立生成影片。“Sora是一個(ge) 視頻輔助工具,它沒辦法體(ti) 驗人的真實感受。”而在影視創業(ye) 相關(guan) 行業(ye) 中,人在真實場景中的感受與(yu) 體(ti) 驗,對影視創作至關(guan) 重要。

  以影視演員為(wei) 例,一個(ge) 合格的演員隻有在充分了解所飾演角色的性格、背景、生活經曆的基礎上,才能表演出擁有複雜情感的人物,甚至還有些演員需要去體(ti) 驗生活,才能更好地詮釋角色。

  而從(cong) 編劇的角度來看,“使用Sora需要關(guan) 鍵提示詞,它不能憑空製作出一個(ge) 好故事片”。劉宇陽說,編劇與(yu) 其他各行各業(ye) 一樣存在二八定律,有能力的編劇隻占總體(ti) 從(cong) 業(ye) 人員的百分之二十,甚至更少,而這些好編劇擅長的方向也不一樣。

  比如,有些編劇文筆好,劇本讀起來讓人舒服;而有些編劇可能框架做得好,故事概念設計得新穎;另外還有一些人是創造能力強、社會(hui) 經驗豐(feng) 富,可以構造出有深刻含義(yi) 的好故事。

  “創意是最重要的,這也是目前生成式工具無法替代的。”在他看來,編劇的文筆、框架甚至邏輯思維能力都可以通過時間訓練,但想象力不行。“人有多少想象力,有多少社會(hui) 閱曆,就會(hui) 產(chan) 生多少靈感,好的故事需要敏銳的觀察力和想象力支持。”

  與(yu) 此同時,短視頻資深從(cong) 業(ye) 者、字節跳動旗下產(chan) 品西瓜視頻的第一任負責人宋健從(cong) 短視頻社交的角度提出相似觀點。他認為(wei) ,目前生成式視頻的信息量遠不如真實拍攝大,短視頻平台用戶更看重的是人與(yu) 人之間的連接和情緒價(jia) 值。因此,“Sora並不能替代抖音、快手,更不會(hui) 取代此類社交平台。”

  在宋健看來,抖音、快手等短視頻平台的本質是“社交”,特效、動畫,甚至視頻本身隻是個(ge) 形式與(yu) 載體(ti) 。他解釋說,董宇輝長相並不優(you) 異,出身平凡,但仍有大量網友關(guan) 注,這是因為(wei) 他的語氣、表情、觀點的背後是積累了30多年的“經驗數據”總和,網友可以在他身上獲得情感價(jia) 值和連接。

  不過新技術的出現也使一些人感到焦慮。劉宇陽也承認,“Sora麵向用戶開放後,會(hui) 對影視行業(ye) 內(nei) 一些工作產(chan) 生威脅。未來受Sora影響最大的可能是玄幻類影片,因此特效製作團隊可能受到比較大的打擊。”

  同一時間,太平洋彼岸的美國好萊塢,也因Sora的發布引發強烈震動。美國《紐約時報》2月21日報道,部分技術人員稱,多數情況下,製作一部電影昂貴又耗時,經常需要數十或數百人,但Sora的出現,將降低影片生產(chan) 成本,未來製作一部與(yu) “漫威大片”具有相同複雜視覺效果的電影,可能隻需要一個(ge) 特效製作人員。

  宋健說,相比於(yu) 人力成本,圖片和視頻生成能夠節約大量時間和經濟成本,比如幫助公司的廣告客戶低成本、便捷地製作視頻。

  或許,低成本的設計、剪輯工作會(hui) 被技術取代。

  “人們(men) 更需要知道技術是幹什麽(me) 的、如何適用於(yu) 市場”

  技術在一路狂奔,人們(men) 要如何跟上技術發展的速度?技術又如何更好地服務人類?

  OpenAI公司很謹慎。截至目前,Sora並未對用戶開放使用,而是首先提供給被稱為(wei) “紅隊成員”(red teamers)的網絡安全教授,用以評估產(chan) 品的危害或風險。

  不難看出,倫(lun) 理問題仍是業(ye) 界討論與(yu) 商榷的重點。

  牛津互聯網研究所客座政策研究員穆塔勒·恩孔德(Mutale Nkonde)接受媒體(ti) 采訪時表示,人們(men) 在未來將輕鬆掌握文本轉換視頻的技術,這令她感到振奮。但她也擔心,這些技術工具將會(hui) 嵌入社會(hui) 偏見,不經意間對人們(men) 的日常生活產(chan) 生影響。

  她說,Sora這類工具的出現將對社會(hui) 角色提出新的問題。比如,影視行業(ye) 是否還需要人類臨(lin) 時演員?“從(cong) 政策的角度來看,我們(men) 是否需要開始思考如何保護人類?”

  北京師範大學新聞傳(chuan) 播學院學術委員會(hui) 主任、教授,北京師範大學傳(chuan) 播創新與(yu) 未來媒體(ti) 實驗平台主任喻國明早先接受中青報·中青網記者采訪時,從(cong) 相似角度提出了思考。他認為(wei) ,機器越來越像人一樣思考並不可怕,可怕的是人會(hui) 像機器那樣去思考。算法技術的發展打破了人們(men) 之間智力的圍牆,但也會(hui) 形成對人的個(ge) 體(ti) 價(jia) 值的蔑視、貶低與(yu) 馴化。“人們(men) 如何去形成自己個(ge) 性的生存之地是首要問題。 ”

  喻國明說,在技術不斷革新的情況下,人們(men) 更需要知道技術是幹什麽(me) 的、如何適用於(yu) 市場、怎麽(me) 進行技術的產(chan) 品化。

  “隨著人工智能等新興(xing) 技術逐漸滲透到社會(hui) 生活的方方麵麵,我相信它們(men) 對於(yu) 目前勞動崗位的替代並不是人類的危機,而是人類的福祉。”喻國明認為(wei) ,工業(ye) 革命發生以後,勞動強度的減低是曆史性的趨勢,未來人類勞動會(hui) 得到某種程度上的強度遞減。

  他說,或許人們(men) 可以從(cong) 現在的8小時工作製,轉變為(wei) 未來4小時工作製甚至可能更短。“人類將從(cong) 過去的物質生產(chan) 壓力中釋放出來,擁有更多精神性的、文化性的和個(ge) 性化的追求。”

  但宋健認為(wei) ,當技術剛剛出現的時候,人們(men) 或許對這種新技術寄予厚望,甚至將它稱為(wei) 實現社會(hui) 平等、減輕人群分化的工具,然而技術也天然帶有不平等的力量。

  比如,美國一家非營利組織Common Sense Media曾發布研究報告指出,來自低收入家庭的青少年每天在電子屏幕上平均會(hui) 花8小時7分鍾,而高收入家庭的青少年每天隻會(hui) 花4小時42分鍾。從(cong) 這樣的對比來看,電子產(chan) 品是這個(ge) 時代最低廉的娛樂(le) 消遣方式,它可以用來替代其他如教育、陪伴等更“昂貴”的東(dong) 西。

  此外,宋健擔憂地說,這些年,從(cong) DALL-E、Midjourney等靜止圖像生成器的發展中不難看出,短短一兩(liang) 年時間人工智能就可以使機器生產(chan) 的圖像與(yu) 真實照片幾乎毫無差別。未來隨著生成式工具的發展,Sora是否會(hui) 成為(wei) 一種快速且低成本的深度偽(wei) 造工具,加劇網絡信息的判斷難度和不平等,這個(ge) 仍未可知。

  監管要如何發力

  當披著高科技外衣的生成式視頻讓互聯網中存在的問題更難被“看見”,監管變得尤為(wei) 重要。

  在中國互聯網協會(hui) 法工委副秘書(shu) 長胡鋼看來,“文字生成視頻”大模型Sora標誌著人工智能生成內(nei) 容(AIGC)的跨越式發展,但它也存在一定濫用風險。

  胡鋼說,這項技術可能造成顯性風險與(yu) 實質危害,損害個(ge) 人和組織的人格和財產(chan) 權益,甚至嚴(yan) 重危害社會(hui) 秩序和國家安全,必須全過程有效治理。

  “我國已經建構了人工智能多元化監管機製,實現了多維協同治理體(ti) 係。”胡鋼說,未來我國需要及時響應即將生效的歐盟《人工智能法案》和美國係列人工智能立法的挑戰,強化國際立法競合與(yu) 協調,促成全球防範和製止人工智能風險共識,推動普適性的高風險人工智能係統的監管措施。“特別是協同風險評估、安全測試、相互認證、透明度和可解釋性要求,以實現數據保護、隱私捍衛和國家安全的共同目標。”

  與(yu) 此同時,版權問題仍在被討論。去年12月,《紐約時報》起訴OpenAI及其合作夥(huo) 伴微軟,聲稱其侵犯了與(yu) 人工智能係統相關(guan) 的新聞內(nei) 容的版權,此事還未有定論。

  值得注意的是,此次OpenAI公司並沒有透露用於(yu) 培訓Sora有多少視頻,也沒有透露培訓視頻可能來自哪裏,隻在采訪中向《紐約時報》透露,該語料庫包含的視頻既是公開的,也被版權所有者許可。

  Sora基本完成了對物理世界的模擬,在人工智能領域取得大踏步前進,使人們(men) 對中美之間的差距產(chan) 生擔憂,但多位業(ye) 內(nei) 人士向記者表示,中國從(cong) 很久以前就把人工智能列為(wei) 發展重點,將不斷縮短中美之間的技術距離,未來在應用AI技術領域,完全有機會(hui) 走在世界前列。

  中青報·中青網見習(xi) 記者 李悅 記者 李若一 來源:中國青年報

(責編:常邦麗)

版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。