o1 Pro挑战最难本科数学考试,36分钟16秒交卷
o1 Pro挑战最难本科数学考试,人类要考6小时,AI半小时交卷!
普特南数学竞赛(The Putnam exam),今年刚刚举行,卷子新鲜出炉就被拿来测试AI了。
这个比赛有多难呢?看了一下历年成绩,只能说令人咂舌——
通常由数学专业的本科生参加,满分120分,但平均分通常是0分或1分。
自1938年举办以来,截至2021年只有5人满分。
再看一组2003年的数据,在3615名参赛学生中,有1024人(28%)得分10分或以上,42分就能进入前1%。
最终,个人得分前五名的学生获得普特南学者称号。而经过这种难度的“磨炼”,普特南学者中后来诞生了3位菲尔兹奖得主以及两位诺贝尔物理学奖得主。
总之一句话,即使对美国顶尖大学的顶尖数学学生来说,这个比赛的难度都堪称地狱级。
所以,o1 Pro具体表现如何呢??
o1 Pro挑战最难本科数学考试
普特南数学竞赛于每年12月的第一个周六举行,总共上下两场(每场3小时),每场6道题,每题10分,考查范围覆盖了本科数学中的高级概念,包括群论、集合论、图论、格论和数论等。
由于刚考完,官方还未正式公布今年的参考答案,所以下面我们先整体感受一下。
从时间来看,Pro完成12道题用时36分钟16秒,交卷速度非常快,平均每道用时2~3分钟。
完成的题也很复杂,随机挑一道康康。
比如这道A6,需要考生通过序列所生成的函数,来构建矩阵,并最终计算出这个矩阵的行列式。
这是一个典型的组合数学和线性代数的交叉问题。
最终,Pro给出了一大堆让人头疼的数学公式进行解答。(非专业选手两眼一黑的程度)
为了进一步了解Pro的答题过程,我们再挑一道网友们都在cue的题——A1。
原题及Dan Hendrycks博士输入的提示词如下:
大意为,确定所有正整数
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。