ChatGPT通過美放射學委員會考試_博覽

ChatGPT通過美放射學委員會考試

劉霞發布時間：2023-05-18 09:09:00來源：科技日報

　　科技日報北京5月17日電（記者劉霞）加拿大科學家在16日出版的《放射學》雜誌上刊登新論文稱，最新版本的ChatGPT通過了美國放射學委員會(hui) 的考試，突出了大型語言模型的潛力，但它也給出了一些錯誤答案，表明人們(men) 仍需對其提供的答案進行核查。

　　為(wei) 評估ChatGPT在美國放射學委員會(hui) 考試問題上的表現並探索其優(you) 勢和局限性，多倫(lun) 多大學研究人員首先測試了基於(yu) GPT-3.5的ChatGPT的表現。研究團隊使用了150道選擇題，這些選擇題與(yu) 加拿大皇家學院和美國放射學委員會(hui) 考試的風格、內(nei) 容和難度相當。這些問題不包括圖像，分為(wei) 低階（知識回憶、基本理解）和高階（應用、分析、綜合）思維問題。高階思維問題可進一步細分為(wei) 影像學表現描述、臨(lin) 床管理、計算和分類、疾病關(guan) 聯。

　　研究人員發現，基於(yu) GPT-3.5的ChatGPT的正確率為(wei) 69%，接近70%的及格線。該模型在低階思維問題上表現相對較好，正確率為(wei) 84%，但回答高級思維問題時表現不佳，正確率僅(jin) 為(wei) 60%。而性能更優(you) 異的GPT-4的正確率為(wei) 81%，且在高階思維問題上的正確率為(wei) 81%，遠好於(yu) GPT-3.5。但GPT-4在低階思維問題上的正確率僅(jin) 為(wei) 80%，答錯了12道題，而GPT-3.5全部答對了這些題目，這引發了研究團隊對GPT-4收集信息的可靠性的擔憂。

　　這兩(liang) 項研究都表明，ChatGPT會(hui) 有提供不正確答案的傾(qing) 向，如果僅(jin) 僅(jin) 依靠它獲取信息，非常危險，因為(wei) 人們(men) 可能意識不到其給出的答案是不準確的，這是它目前麵臨(lin) 的最大的問題。（來源：科技日報）

（責編：王東）

ChatGPT通過美放射學委員會考試

相關閱讀

專題推薦

微觀

賞閱

資料雲

即時新聞