超算互聯網:讓算力走進千行百業
深入推進建設以國家超算互聯網為(wei) 代表的新一代算力網絡基礎設施,並不能靠簡單的算力堆砌,而是要實現網絡、算力調度、產(chan) 業(ye) 鏈、數據要素治理等多方麵的資源協同,強化東(dong) 西部跨域統籌發展。
吳曉明 國家超級計算濟南中心主任
讓算力像電力一樣走進千家萬(wan) 戶、賦能千行百業(ye) ,這一20年前提出的設想如今正成為(wei) 現實。8月26日,2023年CCF全國高性能計算學術年會(hui) 在山東(dong) 省青島市落下帷幕,超算互聯網成為(wei) 與(yu) 會(hui) 專(zhuan) 家學者熱議的話題。
目前,我國算力網絡基礎設施不斷完善,各行各業(ye) 數字化進程持續加速,人工智能、數字孿生等技術迅速發展,對算力,尤其是高性能算力的需求呈爆發式增長。與(yu) 此同時,高性能算力地區供需分布不均、應用生態不完善、持續運營困難等問題製約著我國數字經濟高質量發展。在這一背景下,超算互聯網應運而生,成為(wei) 破解我國超算發展難題的一把關(guan) 鍵“鑰匙”。
用互聯網思維發展超算服務
作為(wei) 當之無愧的“國之重器”,超級計算機距離我們(men) 的日常生活並不遙遠。小到每天看到的天氣預報,大到國產(chan) 大飛機C919,背後都有超算的身影。中國工程院院士、清華大學計算機係教授鄭緯民表示,超算如今已廣泛應用於(yu) 氣象預測、生物製藥、航空工業(ye) 等領域,並在產(chan) 業(ye) 數字化過程中發揮著重要作用。
鄭緯民指出,我國超算的實力毫無疑問處於(yu) 國際第一梯隊。在6月份發布的最新一期全球超算500強榜單中,我國有兩(liang) 台超級計算機位列前十,超級計算機總數更是達到了134台,位列全球第二。
但也應該看到,我國超算麵臨(lin) 著算力設施分布不均衡、水平參差不齊、應用軟件自主研發和推廣應用不足等問題。國家超級計算濟南中心主任吳曉明表示,由於(yu) 超算的技術門檻比較高,且尚未形成豐(feng) 富的應用軟件生態,目前超算的應用仍局限於(yu) 比較傳(chuan) 統的高性能計算領域,如天氣預報、大型工程設計、基礎科學研究等。
超算互聯網的核心目標是讓超級計算機實現從(cong) 傳(chuan) 統的提供算力到提供服務的革命性轉變。“我們(men) 希望通過打造超算互聯網,把各個(ge) 超算中心連在一起,形成更大的算力平台,並且利用互聯網思維,打造更為(wei) 豐(feng) 富的超算應用生態,從(cong) 而能夠直接通過平台對外提供超算服務。”吳曉明表示,超算互聯網及其應用生態的打造,將有利於(yu) 降低超算應用的門檻,讓超算從(cong) “陽春白雪”走向普及普惠,加快滲透千行百業(ye) 、走進千家萬(wan) 戶。
未來,有超算需求的用戶可以直接打開超算互聯網,實現一站式的超算產(chan) 品瀏覽、下單、支付、應用等。用戶看到的將不再是某個(ge) 超算中心、某台計算機,而是一個(ge) 能夠直接解決(jue) 問題的完整應用軟件或解決(jue) 方案。“我們(men) 希望超算互聯網未來能像淘寶、京東(dong) 一樣,直接向用戶提供可應用的超算產(chan) 品,降低超算的應用門檻,更好地賦能數字經濟發展。”吳曉明說。
研發新技術破解互聯難題
超算互聯網的關(guan) 鍵在於(yu) 互聯。隻有實現高速互聯,分布在各地的超算資源才有可能整合為(wei) 一個(ge) 有機整體(ti) ,麵向各行各業(ye) 提供高性能的計算服務。“雖然叫作超算互聯網,但在網絡中流動的並不是算力,而是數據。”國家超級計算濟南中心副主任潘景山表示,在超算互聯網中,數據的傳(chuan) 輸速度直接影響到計算效率。
影響數據傳(chuan) 輸速度的兩(liang) 大因素是帶寬和延遲。帶寬即單位時間內(nei) 能夠通過的最大數據量,延遲則是信息在傳(chuan) 輸介質中傳(chuan) 輸所用的時間。
“比如,在網絡正常的情況下,從(cong) 北京的清華大學傳(chuan) 輸4T大小的數據到江蘇的國家超級計算無錫中心太湖之光超級計算機需要5天。但若我們(men) 把數據都刻成盤,然後用快遞寄過去,第二天下午就到無錫了。”談及目前帶寬較低、延遲較高帶來的影響,鄭緯民形象地解釋道。
目前我國正式掛牌的超算中心有十餘(yu) 家。讓這十餘(yu) 家超算中心連在一起成為(wei) 一台“大機器”,需要網絡具有極高的帶寬和極低的延遲。高帶寬、低延遲實現起來並不容易。
“以往我們(men) 用的光纖鏈路最大的帶寬約為(wei) 100G或200G,每百公裏延遲約為(wei) 1.5毫秒,但這並不能滿足超算互聯網建設的需求。”潘景山介紹,通過持續攻關(guan) ,國家超級計算濟南中心已在高速網絡通信、網絡資源感知調度、算力網絡融合和安全方麵突破了一批關(guan) 鍵技術,並首次建立起了基於(yu) 長距IB通信技術的濟南—青島超算互聯網試驗網,它的帶寬達400G,500公裏通信距離的網絡延遲由原先的雙向10毫秒以上降低至5毫秒左右。“通過這一網絡,濟南、青島兩(liang) 地的超級計算機可以連接成一個(ge) 整體(ti) ,發揮更大的作用。”潘景山舉(ju) 例道,當借助濟南—青島超算互聯網試驗網進行地球係統模擬計算時,可以將其拆分為(wei) 大氣和海洋兩(liang) 個(ge) 模式,在兩(liang) 地分別進行協同計算,大大提升計算效率。
高帶寬、低延遲給超算互聯網帶來的極致性能,也將顯著擴大其在產(chan) 業(ye) 中的應用規模。例如國家超級計算濟南中心與(yu) 濰柴集團合作開展的發動機仿真模擬計算項目,產(chan) 生的數據量達到TB級。“如果我們(men) 用傳(chuan) 統互聯網傳(chuan) 輸這些數據,可能需要傳(chuan) 2—3天,對設計人員來說,這嚴(yan) 重影響工作效率。”潘景山表示,借助高帶寬、低延遲的超算互聯網,TB級的數據量隻需極短時間便可完成傳(chuan) 輸。“如果說傳(chuan) 統互聯網是數據傳(chuan) 輸的‘高速公路網’,那麽(me) 高帶寬、低延遲的超算互聯網則是運行能力成倍提升的‘高鐵網’。”潘景山如是說。
壯大平台生態賦能產(chan) 業(ye) 發展
相比傳(chuan) 統的超算應用模式,超算互聯網可提供統一、完整的超算服務。實現這個(ge) 目標,需要在運營模式、平台生態、產(chan) 業(ye) 培育等方麵同步發力。
“我們(men) 深知,深入推進建設以國家超算互聯網為(wei) 代表的新一代算力網絡基礎設施,並不能靠簡單的算力堆砌,而是要實現網絡、算力調度、產(chan) 業(ye) 鏈、數據要素治理等多方麵的資源協同,強化東(dong) 西部跨域統籌發展。”吳曉明建議,超算互聯網未來發展需要連接產(chan) 業(ye) 生態中的算力供給、應用開發、運營服務、用戶等各方能力和資源,構建一體(ti) 化超算算力網絡和服務平台。同時,還需要緊密連接供需雙方,通過市場化的運營和服務體(ti) 係,實現算力資源統籌調度,降低超算應用門檻,並推動計算技術向更高水平發展,促進核心軟硬件技術深度應用,輻射帶動產(chan) 業(ye) 生態的發展與(yu) 成熟。潘景山也指出,應聯合超算中心、運營商、軟件供應商和用戶合作建設超算互聯網,打造超算共同體(ti) ,這樣才能讓我國數字經濟真正實現以“高鐵速度”發展。
高性能算力能夠驅動產(chan) 業(ye) 的發展,大範圍、大規模的產(chan) 業(ye) 應用也能為(wei) 算力升級提供動力。目前,國家超算互聯網平台已開放第三方企業(ye) 入駐,並明確了入駐企業(ye) 條件:可提供基礎超算IAAS服務等基礎資源;提供行業(ye) 應用軟件資源;提供多學科行業(ye) 應用服務等平台資源;提供多樣數據模型、源碼等資產(chan) 資源,以及提供各種類型的算力服務。截至8月,已有35家超算上下遊單位成功入駐國家超算互聯網平台,另外有近百家單位遞交了聯合體(ti) 入會(hui) 申請,這將為(wei) 超算互聯網平台持續注入活力。(記者都芃 通訊員 申暢 王聰)
版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。