OpenAI o1、DeepSeek R1 應考東京大學入學考試 足夠合格尤其英語最強

| 蘇家華 | 09-04-2025 07:22 |
OpenAI o1、DeepSeek R1 應考東京大學入學考試 足夠合格尤其英語最強

用 AI 模型應考大學的入學考試,雖然不是新鮮事,但最近 OpenAI o1 及 DeepSeek R1 一同應考東京大學理科 3 類入學試,都成為了科技界熱話,且兩者得分都足夠合格外,尤其英語部分更是得到最高分。

即刻按此,用 App 睇更多產品開箱影片

OpenAI o1、DeepSeek R1 應考東京大學入學考試

最近 OpenAI o1 及 DeepSeek R1 一同應考東京大學理科 3 類入學試,測試內容涵蓋 2025 年度東京大學入學考試科目,並由 AI 初創公司 Life Prompt 提供答案輸出,而知名預備學校河合塾之專業講師則負責評分。從考試分數可見,OpenAI o1 及 DeepSeek R1 的 374 分及 369 分都高於東大理科 3 類合格分數 368.7 分,證明他們的「實力」是可應付這些試題的。

OpenAI o1、DeepSeek R1 應考東京大學入學考試 足夠合格尤其英語最強
最近 OpenAI o1 及 DeepSeek R1 一同應考東京大學理科 3 類入學試,測試內容涵蓋 2025 年度東京大學入學考試科目。

考題得分方面,不論 OpenAI o1 及 DeepSeek R1 都在英語部分表現最出色,得分率均逾 75%,河合塾英語講師久恆秀雄的評價,是兩個模型的英語表達上幾乎沒有單字和語法的錯誤,水平遠超東大考生平均水準。

OpenAI o1、DeepSeek R1 應考東京大學入學考試 足夠合格尤其英語最強
知名預備學校河合塾之專業講師則負責評分。

之不過,在數學科上就看到兩個 AI 模型的表現稍有差別,如滿分為 120 分的理科數學考試中,Open o1 只得 38 分,DeepSeek R1 也得 49 分而已,得分明顯低於合格者的平均分,尤其在圖形處理和論證問題上常出現論述錯誤和說明不足的情況。負責數學評分的講師香阪季京直高,兩款 AI 模型的數學論證上表現還有待改善,特別是 DeepSeek R1 在理科 1 類和理科 2 類的共通考試均不達合格門檻。

OpenAI o1、DeepSeek R1 應考東京大學入學考試 足夠合格尤其英語最強
不論 OpenAI o1 及 DeepSeek R1 都在英語部分表現最出色,得分率均逾 75%,水平遠超東大考生平均水準。

【熱門報道】

視訊播放器 正在載入。
目前時間 0:00
總共時間 0:53
載入完畢: 0%
串流類型 直播
剩餘時間 0:53
 
1x
    • 章節
    • 關閉描述, 選擇
    • default, 選擇

    【精選消息】

    Source: 沖縄タイムス+プラス

    相關文章

    Page 3 of 13

    最新內容