國產AI芯片係統應練好“內功”
“大模型訓練需要大量數據,因此對算力的要求很高。”在日前召開的首屆“AI Tech Day(人工智能科技日)”峰會(hui) 上,中國工程院院士、清華大學計算機科學與(yu) 技術係教授鄭緯民介紹,自去年12月份以來,大模型需要的AI芯片漲價(jia) 一倍,國外芯片“一卡難求”。盡管國內(nei) 數十家公司在AI芯片研製和生產(chan) 方麵取得了很大進步,但國產(chan) 芯片尚未受到市場的廣泛青睞。
對此,與(yu) 會(hui) 專(zhuan) 家呼籲,解決(jue) 算力難題,應重塑大模型算力生態,助力國產(chan) AI芯片係統練好“內(nei) 功”。
加強底層研發,提升國產(chan) AI芯片“包容力”
“如果基於(yu) 國外芯片編寫(xie) 的軟件能夠很容易移植到我們(men) 的國產(chan) 芯片係統上來,用戶就會(hui) 感覺到國產(chan) 芯片好用。”鄭緯民認為(wei) ,但由於(yu) 生態建設不完備,目前國產(chan) 芯片在大模型訓練相關(guan) 軟件移植方麵表現不太順暢,因此需要進一步加強底層研發,做好包括編程框架、並行加速、通信庫在內(nei) 的軟件研發工作。
“為(wei) 了發展AI芯片的生態體(ti) 係,一些國際大企業(ye) 甚至可以放棄一些高利潤的項目和方案。”英博數科CEO周韡韡介紹,營造生態需要發動整個(ge) 行業(ye) 的創新力量,例如國際企業(ye) 曾通過主動開源部分軟件的底層代碼、讓利給基於(yu) 芯片的軟件開發者,形成以AI芯片為(wei) 核心的算力體(ti) 係。
相較於(yu) 芯片本身的硬件性能提升,鄭緯民認為(wei) ,通過營造生態,提升國產(chan) AI芯片的“包容力”更加急迫。“如果算力生態做得非常好,即使國產(chan) 芯片的硬件性能隻有國外性能的60%及以上,大家也會(hui) 喜歡用。”鄭緯民說,但如果算力生態沒做好,新型軟件跑不起來、軟件移植不順暢,即便硬件性能達到國外的120%,照樣難以轉變為(wei) 有效算力。
為(wei) 凝聚行業(ye) 力量、改變當前的大模型算力生態,英博數科聯合百川智能、中國計算機學會(hui) 、清華大學等單位共同成立北京AI創新賦能中心技術委員會(hui) 。作為(wei) 該技術委員會(hui) 的顧問,清華大學電子工程係教授汪玉表示:“在大模型領域,我們(men) 將同時從(cong) 軟件側(ce) 和硬件側(ce) 方麵開展聯合優(you) 化。在打造通用型人工智能服務平台的同時,推動高性能計算領域智能芯片和高模態電路關(guan) 鍵技術的研發。”
共建基礎生態,推動現有算力融合創新
“大模型興(xing) 起之前建設的算力,相對而言利用率較低,跟不上現階段大模型對算力指數級發展的需求。”艾瑞谘詢產(chan) 業(ye) 數字化研究院負責人徐樊磊介紹,為(wei) 提升整體(ti) 算力效率和滿足差異化需求,應建立支撐大模型萬(wan) 億(yi) 量級參數計算的“智算中心”。“智算中心”可利用現有高質量數據中心,通過提升組網能力、協同能力、軟硬件適配能力等實現部署。當前,“萬(wan) 卡”級別的智算中心正在主要節點城市發展起來。
與(yu) 會(hui) 專(zhuan) 家認為(wei) ,推動現有算力融合創新將進一步提升當前算力使用效率。“1萬(wan) 塊卡(AI芯片)應該怎麽(me) 連?是不是每塊卡和其他9999塊直連?如果這樣,中間的連接將需要1萬(wan) 乘以9999個(ge) 連接卡,成本將非常高。”鄭緯民說,通過最有效的連接支持模型並行、數據並行等不同的要求,是融合創新的關(guan) 鍵。
大模型背後運行的是更加複雜的網絡架構和智能算法。如何在降本增效的同時,促進大模型算力使用門檻的降低?“‘雲(yun) ’模式是打通供需不對稱、達成算力普惠的有效路徑。”周韡韡表示,通過共享、共融集結現有算力,萬(wan) 卡平台及配備高效網絡交互機製的大模型訓練與(yu) 推理平台,可以開放給大企業(ye) 、小微企業(ye) 共用。通過搭載數據遷徙、訓練數據庫等工具,雲(yun) 平台等基礎生態的搭建有望讓算力像水和電一樣隨取隨用。(記者 張佳星)
版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。