穀歌發布最新人工智能模型Gemini 聲稱性能超越GPT-4和人類專家_博覽

穀歌發布最新人工智能模型Gemini 聲稱性能超越GPT-4和人類專家

張夢然發布時間：2023-12-11 09:41:00來源：科技日報

　　科技日報北京12月7日電 (記者張夢然)穀歌公司6日宣布推出一種名為(wei) Gemini的新人工智能模型，聲稱該模型在一係列智力測試中的表現優(you) 於(yu) OpenAI的GPT-4模型和“專(zhuan) 家級”人類。

　　Gemini已針對不同的應用創建了3個(ge) 版本，分別是Nano、Pro和Ultra。穀歌拒絕回答有關(guan) Pro和Ultra的規模、它們(men) 包含的參數數量、訓練數據的規模或來源等問題。

　　其最小版本Nano旨在在智能手機上運行，實際上有兩(liang) 種模型：一種用於(yu) 速度較慢的手機，擁有18億(yi) 個(ge) 參數；另一種用於(yu) 功能更強大的手機，擁有32.5億(yi) 個(ge) 參數。

　　穀歌聲稱，Gemini的中檔Pro版本擊敗了其他一些模型，但更強大的Ultra超過了所有現有AI模型的能力。它在行業(ye) 標準MMLU基準上的得分為(wei) 90%，而“專(zhuan) 家級”的人類預計能達到89.8%。

　　這是人工智能首次在測試中擊敗人類，也是現有模型中得分最高的。該測試涉及一係列棘手的問題，包括邏輯謬誤、日常道德問題、醫療問題、經濟和地理。

　　在同一測試中，GPT-4的得分為(wei) 87%，LLAMA-2的得分為(wei) 68%，Anthropic Claude 2的得分為(wei) 78.5%。Gemini在其他9項常見基準測試中的8項中擊敗了所有這些模型。

　　去年，穀歌“深度思維”發布的AlphaCode可擊敗50%的人類開發人員，而新發布的Gemini聲稱可擊敗85%的人類編程師。

　　穀歌“深度思維”的艾力·柯林斯表示，Gemini“幾乎在每個(ge) 領域都是最先進的”。

　　【總編輯圈點】

　　Gemini目前沒有可供測試的版本，但穀歌卻演示了它兩(liang) 種很“實際”的功能——解決(jue) 家庭作業(ye) 問題、處理實時視頻能力。這不禁讓“特定人群”驚呼：我現在就需要它！而對業(ye) 內(nei) 人士來說，這個(ge) AI更值得注意之處，是它不僅(jin) 能力最強，還最通用，這意味著其可以適應各種任務。與(yu) 當前許多專(zhuan) 注於(yu) 文本的模型不同，Gemini接受過文本、圖像和聲音方麵的綜合訓練，能接受所有這些格式的輸入然後再輸出，甚至，它還比所有“前輩”模型們(men) 更擅長搞開發。

（責編：王東）

穀歌發布最新人工智能模型Gemini 聲稱性能超越GPT-4和人類專家

相關閱讀

專題推薦

微觀

賞閱

資料雲

即時新聞