陶哲轩使用GPT5
栏目:专题报道 发布时间:2025-10-12 09:37
奥菲斯量子比特的梦辰鲁羽 |公众号Qbitai陶哲轩和GPT-5 Pro这对组合再次发威,解决了一个3年没有解决的问题。而这是一个“不属于自己专业知识范围”的问题:差分几何领域的一个开放性问题-It。你应该知道复习、​​数论、组合子等。陶哲轩熟知整数、函数、运算符的特性。差异-几何变化更关注流形的特性,常用的工具也不同。陶先生只是根据自己的直觉给出了一个大概的方向,而GPT-5 pro则是从复杂的计算到严格的证明,帮助人们抓住基本逻辑,打破传统思维的限制。即使有了AI的帮助,我最终发现我的直觉是错误的,但通过这个过程我对问题有了更好的理解。随着经验解决这个跨界问题后,哲轩人对于人工智能在学术研究中的作用也有了新的思考。他毕业了:AI非常有用——小规模有用,中等规模没什么用,大规模有用。人工智能是从计算到证明再到实践。我们先看3年前Mathoverflow提出的原始问题:假设三维空间中有一个地方被光滑的拓扑球体包围,且该表面的曲面曲率绝对量不超过1,那么最小等价于该球体单位体积所围成的体积?陶哲轩最初的想法是将问题限制在星形区域,借助积分不等式向前推进。但他的差分几何有点生疏,所以他请人工智能帮助他进行这些计算。结果GPT-5 Pro思考了11分18秒。它不仅完成了所有的计算,还提供了完整的专业星案例问题的。证明过程使用了各种不等式和恒等式,其中一些是人们熟悉的(例如斯托克斯“定理”和威尔莫尔不等式),并且还有闵可夫斯基的第一个积分公式,这是他第一次与之交互。在这些不等式以及算术几何不等式中,星型情况的证明实际上是一行 argumEnto。到目前为止,非常好。接下来他需要验证证明的各个步骤,但是在互联网上找不到有用的资源。再次质疑AI后,他收到了两个他喜欢的证明:一个是基于他使用差异-定理提出的路线,另一个是基于他没想到的流程方法。通过人工智能的计算和证明,陶哲轩打算将其视为扰动椭圆差方程的一个小问题,而人工智能也对这个想法进行了表演。尽管在估计扰动非时会出现轻微错误线性项,它不会耗尽。而且,AI主动指出,特殊情况实际上可以返回星形结果。部分自定义方程摄动理论的方法成功地解决了表面形状与地球单位没有差异时的情况(小数据)。但真正困难且未解决的是曲面形状与球面的差异巨大时的问题(大数据)。陶哲轩意识到,问题可以在大型边界计算中得到简化,但人工智能使用此过程提供的结果非常有才华,而且并不有趣,本质上是所有可能形状的完整列表。最终,陶哲轩发现,他构想的数字可以在有限的时间内解决给定条件下的所有特殊情况,但无法处理一般情况,而人工智能只是跟着问题走。最后总结一下:虽然问题不是最终彻底解决,在AI的帮助下,陶哲轩对问题的理解变得更深了。陶哲轩的想法:人工智能工具的价值虽然问题解决了,但陶哲轩仍在思考。回顾整个问题解决过程,人工智能在“小规模”问题上表现良好,只犯了一些小错误,并在文献中贡献了一些有用的想法,但哲轩人以前从未为人所知。但为了进一步解决这个问题,我们需要一位真正专业的几何专家的帮助。在“中等规模”方法中,人工智能稍微不足为奇,强化了特伦斯·曼对问题的直觉而不是询问问题的错误。陶哲轩的直觉一开始就错了,艾未未发现问题,果然什么都说得好。但从“大规模”资源的角度来看,人工智能是有用的,尽管主要是在间接意义上:在人工智能的帮助下,有可能研究并最终放弃现在被认为不合适的程序。陶哲轩将这次经历与他之前的实验进行了比较。在之前的实验中,他给人工智能一项任务,让人工智能对结果有很好的直觉。在这种情况下,人工智能更具创造性,可以提供它不知道的信息,但引导人工智能朝富有成效的方向发展也更加困难。他认为,将人工智能与自身专业领域之外的问题联系起来似乎有一定价值,但人们必须继续保持谨慎并保持对情况的认识。这次经历也印证了Tao之前的观点:一个工具的有效性应该由很多KALiski来衡量。他之前提出了四个不同的效率步骤:形式证明中的任何一行、任何单个引理、任何定理的完整证明以及整本书的研究。当前的许多自动化工具可以加速其中一种规模的形式化,但与直觉相反,对此类工具的过度忠诚会降低福尔马林与其他秤的能力。他认为最佳的自动化水平实际上严格在0%到100%之间。每个规模都有足够的自动化,以减少繁琐的重复任务,但每个规模仍然有足够的“循环中的人”来评估和解决局部问题,以便人们在所有规模上保持工作结构感。如果你将人工智能过度基准化为单一规模,你就可以结束对长期目标的有害影响。三年前Terence People与Chatgpt陶哲轩探索AI-Matematics辅助数学工作可能性的合作历程——Chatgpt仅发布。陶哲轩在它诞生的时候就认真地意识到了它的作用,并对黎曼猜想提出了临时的质疑,但得到的结果却让他失望了:Chatgpt给出了一个看似理性且有一定答案的答案,但仔细观察并没有真正的深层内容。。此时ChatGPT并没有完全理解数学问题的本质,只是包装和占用了一些低质量的内容。这意味着传统的表面探索方法不再准确,需要对核心内容进行手动筛选,例如逐行阅读文本。因此,早期,特伦斯·曼对AI工具抱有怀疑的态度。他认为人工智能在数学中的作用是提供对答案的估计,然后人类数学家通过传统方法逐步完善它们。转折点已经到达GPT-4。陶哲轩尝试使用GPT-4来帮助处理统计数据,即输入原始电子表格数据,找到所需的相应函数和计算。在短短几分钟内,GPT-4 就完成了人们一天的工作,其中只有很少的部分需要被证明。这也让陶哲轩期待AI将AI集成到软件工具中,尤其是能够处理90%以上的任务乳胶的比较问题解决。我现在可以说,第一天 GPT4 为我省去了很多繁琐的任务。后来,他开始使用GPT-4来处理他熟悉的领域中的某些数学问题,如以下问题:证明递归公式(确定R)可以得到a(n+1)。 GPT4从协作的角度提出了八种不同的方法。其中,函数的开发方式受到了陶哲轩的关注,他沿着这条解决路径,最终利用手动计算的方式解决了问题。起初,陶哲轩想使用渐近检验方法,但事实证明人工智能将有助于更快地找到正确的解决方案。同时,他开始要求ChatGPT编写Python来计算下面的长度。虽然与目标预期跟随不同,考虑的是后续的连续整数而不是随后的后续,但是很接近,并且当计算 toient 函数。但代码本身有时候不够简洁,不够好,或者逻辑不够严密,还是需要manu修正和重写。他还尝试使用Copilot写数学论文,但在写证明大纲时,AI陷入了关于随机分析数的长期叙述,并且只在写很短或重复的文本时有效。因此,在陶哲轩看来,此时写数学论文的乐趣大于好处。 GPT-O1发布后,陶哲轩也第一次尝试了数学能力。显然,相比上一代,GPT-O1幻觉问题已经解决,在正式工作中也发挥了重要作用。然而,它仍然因复杂的评估问题而失败,并且没有在概念中产生关键思想。哲轩的人类将这一代模型称为中等但并非完全无能的数学“毕业生”“研究”,而之前的模式更接近于无能的“毕业生”水平。不过,他也认为,在一两次迭代以及与其他工具的融合中,AI将在研究层面的活动中产生不同的结果。今年7月,Openai获得了IMO金奖,这再次引发了人们对AI数学能力的热议。陶哲轩也回应了一篇长文,认为该文还缺乏 审查。测量标准。但同时,他也开始让Chatgpt处理一些更复杂的数学问题。例如,在判断集合是否是ha的子集时,通过理论分析来定义这个问题的答案不是的人哲轩,但是仍然需要一些参数个数来验证一些不等式。最初,直接要求 AI 提供 Python 代码的反例,但始终因为以下原因而受挫: 初始参数问题。后来,陶哲轩调整了做法,逐渐与人工智能对话,使其能够执行启发式计算并查找参数选项。通过自由验证生成的参数,最终解决了问题。陶哲轩总结道,人工智能工具显然可以在找号码等任务中节省大量时间。如果没有人工智能,他就无法考虑这个解决方案,而是寻找加法的理论分析。关于如何减少AI对数学问题的幻想或废话,满哲轩显然有自己的一套想法,即详细解释计算任务的每一步,与AI确认每次对话后再进行下一步,输出后使用Python进行向外验证。正如他一直所说,AI正在重塑人类科学范式,其最合理的角色是成为数学家的“副驾驶”或助手,而不是改变人类的创造力、直觉和战略工作。在人工智能的帮助下,数学将有更多的意义未来的实验,而不仅仅是理论。参考链接: [1] https://chatgpt.com/share/68e85CBA-7228-800E-8804-A0F41AA64E14 [3] https://terrytao.wordpress.com/master-posts/返回搜狐查看更多
下一篇:没有了
服务热线
400-123-4567