新利平台 > 即時新聞 > 博覽

穀歌發布最新人工智能模型Gemini 聲稱性能超越GPT-4和人類專家

張夢然 發布時間:2023-12-11 09:41:00來源: 科技日報

  科技日報北京12月7日電 (記者張夢然)穀歌公司6日宣布推出一種名為(wei) Gemini的新人工智能模型,聲稱該模型在一係列智力測試中的表現優(you) 於(yu) OpenAI的GPT-4模型和“專(zhuan) 家級”人類。

  Gemini已針對不同的應用創建了3個(ge) 版本,分別是Nano、Pro和Ultra。穀歌拒絕回答有關(guan) Pro和Ultra的規模、它們(men) 包含的參數數量、訓練數據的規模或來源等問題。

  其最小版本Nano旨在在智能手機上運行,實際上有兩(liang) 種模型:一種用於(yu) 速度較慢的手機,擁有18億(yi) 個(ge) 參數;另一種用於(yu) 功能更強大的手機,擁有32.5億(yi) 個(ge) 參數。

  穀歌聲稱,Gemini的中檔Pro版本擊敗了其他一些模型,但更強大的Ultra超過了所有現有AI模型的能力。它在行業(ye) 標準MMLU基準上的得分為(wei) 90%,而“專(zhuan) 家級”的人類預計能達到89.8%。

  這是人工智能首次在測試中擊敗人類,也是現有模型中得分最高的。該測試涉及一係列棘手的問題,包括邏輯謬誤、日常道德問題、醫療問題、經濟和地理。

  在同一測試中,GPT-4的得分為(wei) 87%,LLAMA-2的得分為(wei) 68%,Anthropic Claude 2的得分為(wei) 78.5%。Gemini在其他9項常見基準測試中的8項中擊敗了所有這些模型。

  去年,穀歌“深度思維”發布的AlphaCode可擊敗50%的人類開發人員,而新發布的Gemini聲稱可擊敗85%的人類編程師。

  穀歌“深度思維”的艾力·柯林斯表示,Gemini“幾乎在每個(ge) 領域都是最先進的”。

  【總編輯圈點】

  Gemini目前沒有可供測試的版本,但穀歌卻演示了它兩(liang) 種很“實際”的功能——解決(jue) 家庭作業(ye) 問題、處理實時視頻能力。這不禁讓“特定人群”驚呼:我現在就需要它!而對業(ye) 內(nei) 人士來說,這個(ge) AI更值得注意之處,是它不僅(jin) 能力最強,還最通用,這意味著其可以適應各種任務。與(yu) 當前許多專(zhuan) 注於(yu) 文本的模型不同,Gemini接受過文本、圖像和聲音方麵的綜合訓練,能接受所有這些格式的輸入然後再輸出,甚至,它還比所有“前輩”模型們(men) 更擅長搞開發。

(責編: 王東)

版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。