
用 AI 模型應考大學的入學考試,雖然不是新鮮事,但最近 OpenAI o1 及 DeepSeek R1 一同應考東京大學理科 3 類入學試,都成為了科技界熱話,且兩者得分都足夠合格外,尤其英語部分更是得到最高分。
即刻按此,用 App 睇更多產品開箱影片
OpenAI o1、DeepSeek R1 應考東京大學入學考試
最近 OpenAI o1 及 DeepSeek R1 一同應考東京大學理科 3 類入學試,測試內容涵蓋 2025 年度東京大學入學考試科目,並由 AI 初創公司 Life Prompt 提供答案輸出,而知名預備學校河合塾之專業講師則負責評分。從考試分數可見,OpenAI o1 及 DeepSeek R1 的 374 分及 369 分都高於東大理科 3 類合格分數 368.7 分,證明他們的「實力」是可應付這些試題的。
考題得分方面,不論 OpenAI o1 及 DeepSeek R1 都在英語部分表現最出色,得分率均逾 75%,河合塾英語講師久恆秀雄的評價,是兩個模型的英語表達上幾乎沒有單字和語法的錯誤,水平遠超東大考生平均水準。
之不過,在數學科上就看到兩個 AI 模型的表現稍有差別,如滿分為 120 分的理科數學考試中,Open o1 只得 38 分,DeepSeek R1 也得 49 分而已,得分明顯低於合格者的平均分,尤其在圖形處理和論證問題上常出現論述錯誤和說明不足的情況。負責數學評分的講師香阪季京直高,兩款 AI 模型的數學論證上表現還有待改善,特別是 DeepSeek R1 在理科 1 類和理科 2 類的共通考試均不達合格門檻。
【熱門報道】
視訊播放器 正在載入。
【精選消息】
Source: 沖縄タイムス+プラス