新利平台 > 即時新聞 > 文化

AI賦能影像技術,讓修圖小白秒變大師

發布時間:2022-04-18 15:39:00來源: 科技日報

  美圖影像研究院致力於(yu) 計算機視覺、機器學習(xi) 、增強現實等人工智能(AI)相關(guan) 領域的研發,在人臉技術、人體(ti) 技術、圖像分割、圖像識別、圖像生成、圖像增強等方麵處於(yu) 領先水平,為(wei) 美圖現有和未來的產(chan) 品提供核心算法支持。

  近日,計算機視覺頂級會(hui) 議CVPR 2022公布了會(hui) 議錄取結果,美圖影像研究院(MT Lab)與(yu) 北京航空航天大學可樂(le) 實驗室聯合發表的論文被接收。該論文突破性地提出分布感知式單階段模型(DAS),用於(yu) 解決(jue) 極具挑戰性的多人3D人體(ti) 姿態估計問題。該方法通過一次網絡前向推理同時獲取3D空間中人體(ti) 位置信息以及相對應的關(guan) 鍵點信息,從(cong) 而簡化了預測流程,提高了效率。此外,該方法有效地學習(xi) 了人體(ti) 關(guan) 鍵點的真實分布,進而提升了基於(yu) 回歸框架的多人3D人體(ti) 姿態估計方法的精度。

  實際上,這隻是美圖利用人工智能為(wei) 影像技術賦能的冰山一角。早在2010年,美圖就成立了核心研發部門——美圖影像研究院,該研究院致力於(yu) 計算機視覺、機器學習(xi) 、增強現實等人工智能(AI)相關(guan) 領域的研發,在人臉技術、人體(ti) 技術、圖像分割、圖像識別、圖像生成、圖像增強等方麵處於(yu) 領先水平,為(wei) 美圖現有和未來的產(chan) 品提供核心算法支持,並通過前沿技術推動美圖產(chan) 品發展,曾先後多次參與(yu) CVPR、ICCV、ECCV等計算機視覺國際頂級會(hui) 議,並斬獲冠亞(ya) 軍(jun) 10餘(yu) 項,被稱為(wei) 美圖的“技術中樞”。

  高效精準獲取多人3D人體(ti) 姿態估計結果

  計算機視覺中的經典技術——多人3D人體(ti) 姿態估計在AR/VR、遊戲、運動分析、虛擬試衣等領域具有廣泛的應用潛力,近年來隨著元宇宙概念的興(xing) 起,更是讓這一技術備受關(guan) 注。

  目前,通常采用兩(liang) 階段方法來解決(jue) 多人3D人體(ti) 姿態估計的問題:自頂向下方法,即先檢測圖片多個(ge) 人體(ti) 的位置,之後對檢測到的每個(ge) 人使用單人3D姿態估計模型來分別預測其姿態;自底向上方法,即先檢測圖片中所有人的3D關(guan) 鍵點,之後通過相關(guan) 性將這些關(guan) 鍵點分配給對應的人體(ti) 。

  盡管兩(liang) 階段方法取得了良好的精度,但是需要通過冗餘(yu) 的計算和複雜的後處理來順序性地獲取人體(ti) 位置信息和關(guan) 鍵點位置信息,其速率通常難以滿足實際場景需求,因此多人3D姿態估計算法流程亟須簡化。

  為(wei) 了克服兩(liang) 階段方法存在的問題,該論文提出了一種分布感知式單階段模型用於(yu) 解決(jue) 基於(yu) 單張圖片的多人3D人體(ti) 姿態估計問題。另外,DAS在優(you) 化過程中對3D關(guan) 鍵點的分布進行學習(xi) ,這為(wei) 3D關(guan) 鍵點的回歸提供了極具價(jia) 值的指導性信息,從(cong) 而有效地提升了預測精度。

  此外,為(wei) 了緩解關(guan) 鍵點分布估計的難度,DAS采用了一種迭代更新策略以逐步逼近真實分布目標,通過這樣一種方式,DAS可以高效且精準地從(cong) 單目RGB圖片中一次性獲取多個(ge) 人的3D人體(ti) 姿態估計結果。

  與(yu) 已有的兩(liang) 階段方法相比,該模型可以通過一次網絡前向推理同時獲取人體(ti) 位置信息以及所對應的人體(ti) 關(guan) 鍵點位置信息,從(cong) 而有效地簡化預測流程,克服了已有方法在高計算成本和高模型複雜度方麵的弊端。另外,該方法成功將標準化流引進到多人3D人體(ti) 姿態估計任務中,以在訓練過程中學習(xi) 人體(ti) 關(guan) 鍵點分布,並提出迭代回歸策略緩解分布學習(xi) 難度,來達到逐步逼近目標的目的。通過該模型可以獲取數據的真實分布,有效地提升模型的回歸預測精度。

  人工智能技術大大提升攝影修圖效率

  對人臉皮膚進行精細化的瑕疵修複與(yu) 暗沉祛除,一鍵入“齒”修複牙齒上的瑕疵,照片上模糊的容顏清晰重現,全身美型告別大粗腿、水桶腰……AI技術正讓修圖小白秒變大師。

  一家商業(ye) 攝影機構的業(ye) 務流程基本包括:營銷獲客、攝影服務、後期處理、成品製作等環節。其中,後期修圖是商業(ye) 攝影工作流程中占比高、耗時長、工作量大的一個(ge) 環節。

  在旺季或者拍攝任務激增時,從(cong) 拍攝到出片的周期甚至長達1個(ge) 月左右。尤其是在人像處理部分,非常考驗修圖師的專(zhuan) 業(ye) 功底,而一名合格修圖師的培養(yang) 需要耗費高昂的人力、物力成本,還需要麵臨(lin) 人員頻繁流動的風險。

  美圖創始人兼首席執行官吳欣鴻在接受科技日報記者采訪時表示,據不完全統計,商業(ye) 攝影1年修圖可達120億(yi) 張,大量繁雜的重複性勞動以及較高的技術門檻,給商業(ye) 影樓帶來巨大的成本壓力。借助AI技術完成重複繁雜的後期初修工作,不僅(jin) 能夠提升商業(ye) 攝影後期的修圖效率,同時也為(wei) 商業(ye) 攝影行業(ye) 提供了深度融合美學藝術的專(zhuan) 業(ye) 級圖像處理服務。

  由美圖技術大腦——美圖影像研究院自主研發的美圖雲(yun) 修,通過智能預設功能,一鍵即可完成對照片的批量處理。其中,臉部優(you) 化功能可以修複麵部瑕疵,打造細膩肌膚;妝容調整功能可實現對妝容的智能調節。此外,美圖雲(yun) 修還能夠完成塑造立體(ti) 的麵部五官、分區域實現全身美型、美化身體(ti) 肌膚等80餘(yu) 項修圖工作。同時,靈活自由的參數自定義(yi) 也滿足了用戶對修圖更專(zhuan) 業(ye) 的需求。

  “美圖雲(yun) 修還提供濾鏡特效、牙齒修複、祛雙下巴、勻膚、縮頭、一鍵仿妝、背景增強、多人全身美型等獨特功能,可以幫助影樓快速完成約80%的精修工作。”美圖技術副總裁、美圖影像研究院負責人劉洛麒表示。

  我國影像軟件技術攜手AI大步向前

  今年3月30日,美圖披露2021年全年業(ye) 績報告。報告顯示,2021年美圖研發投入達5.455億(yi) 元,同比2020年增長35%。

  隨著中國影像軟件產(chan) 業(ye) 對技術研發投入的不斷加大,近年來中國影像軟件在技術能力方麵有了很大的進展,有些已經不輸國外同類產(chan) 品。

  “我們(men) 推出的視頻美顏App——Wink,它的視頻人像美化功能需要將人像美顏從(cong) 圖像擴展到視頻維度,這就需要實時的人臉檢測跟蹤、分割、3D建模等技術與(yu) 人像美顏算法進行有機結合,同時還要應對視頻抖動、大側(ce) 臉等極端情況,才能為(wei) 用戶提供滿意的結果。”劉洛麒說。

  “用戶拍攝的照片或視頻存在清晰度低、畫質差、產(chan) 生噪點等問題,我們(men) 利用基於(yu) 深度學習(xi) 的畫質增強技術能夠提高用戶照片與(yu) 視頻的質量,滿足他們(men) 的拍攝需求。同時,我們(men) 也將深度學習(xi) 應用到人像美顏中,例如我們(men) 自主研發的AI勻膚技術,既能祛除臉部瑕疵,同時也保留了細膩的皮膚紋理質感。”吳欣鴻說。

  “我們(men) 基於(yu) AI研發的人體(ti) 美型技術,不是簡單地對人體(ti) 進行拉伸,而是先結合人體(ti) 3D重建、人體(ti) 分割等技術去建立人體(ti) 的三維模型,再利用深度學習(xi) 算法學習(xi) 美化之後的人體(ti) 模型形變,同時對背景的Mesh(網格)進行建模,從(cong) 而緩解背景的變形扭曲,最終實現用戶滿意的人體(ti) 美型效果。”劉洛麒指出。

  此外,美圖證件照應用到的人像摳圖技術,可以實現發絲(si) 級的精細摳圖,完成對證件照人像的一鍵換裝,同時保持人像和背景的光線和諧性。而基於(yu) AI生成的增發技術,可以調整發際線,可以改變發色和發型,還能使頭發顯得更蓬鬆。

  未來,人工智能將如何賦能影像技術?對此,吳欣鴻表示,一方麵,基於(yu) 人工智能的影像技術,將與(yu) 各行各業(ye) 有更多、更深入的結合,這也對影像技術提出了更高的要求。另一方麵,通過3D技術和AR技術等,為(wei) 用戶提供沉浸式和可交互的虛擬化體(ti) 驗也是未來影像技術發展的熱門方向。

  記者 馬愛平

(責編: 常邦麗)

版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。