彭博針對金融業推出大型語言模型BloombergGPT_博覽

彭博針對金融業推出大型語言模型BloombergGPT

發布時間：2023-04-03 09:03:00來源：中國新聞網

　　中新網3月31日電 3月30日，彭博發布公告稱，推出為(wei) 金融界打造的大型語言模型(LLM)——BloombergGPT。

　　圖片來源：彭博網站截圖

　　彭博是一家全球商業(ye) 、金融信息和新聞資訊提供商。3月30日，該公司發布了一篇關(guan) 於(yu) BloombergGPT開發情況的研究論文，詳細介紹了這一大規模生成式人工智能(AI)模型。該大語言模型(LLM)專(zhuan) 門針對各類金融數據進行訓練，以全方位支持金融領域的自然語言處理(NLP)任務。

　　據彭博微信公眾(zhong) 號消息，該模型將幫助彭博改進現有的金融NLP任務，如市場情緒分析、命名實體(ti) 識別、新聞分類和問題回答等。此外，BloombergGPT還將釋放更多新機遇，調動彭博終端上的海量數據，將人工智能的潛力帶到金融領域。

　　據介紹，彭博的研究人員開創了一種混合訓練法，將金融數據與(yu) 通用數據集結合起來訓練模型，以達到在金融基準上取得最佳結果，同時在通用LLM基準上也保持足夠的競爭(zheng) 力。

　　與(yu) 此同時，彭博的機器學習(xi) 產(chan) 品和研究小組和人工智能工程團隊合作，利用彭博在數據創建、收集和整理方麵的資源，構建了迄今為(wei) 止規模最大的專(zhuan) 業(ye) 領域數據集之一。

　　作為(wei) 一家金融數據公司，彭博的數據分析師在四十多年的時間裏收集和維護了運用大量金融用語的文檔。開發團隊從(cong) 這個(ge) 由海量英文金融文檔組成的檔案庫中，提取並創建了一個(ge) 包含3630億(yi) 詞例(token)的金融數據集。這批數據又與(yu) 另一個(ge) 包含3450億(yi) 詞例的公共數據集疊加，成為(wei) 了包含超7000億(yi) 詞例的大型訓練語料庫。

　　彭博的研究團隊利用該語料庫的一部分內(nei) 容，訓練了純解碼器(decoder-only)因果語言模型，包含500億(yi) 個(ge) 參數。團隊還對訓練出的模型進行了基準測試。金融領域的NLP任務采用了一套彭博的自有基準，各類通用NLP任務則采用市麵上流行的基準。

　　彭博稱，BloombergGPT模型在金融任務上的表現遠超類似規模的開放模型，而在一般NLP基準上的表現也達到甚至超過平均水平。

　　彭博首席技術官肖恩·愛德華茲(zi) (Shawn Edwards)還表示，“BloombergGPT將使我們(men) 能夠處理許多新型的應用，不僅(jin) 比定製化模型的表現更好，而且開箱即用，能夠大大縮短上線時間。”

（責編：王東）

彭博針對金融業推出大型語言模型BloombergGPT

相關閱讀

專題推薦

微觀

賞閱

資料雲

即時新聞