童程童美老师直接接听

400-029-09** 400-029-0997 转 26991
查看完整号码
扫码拨号
微信扫码拨号

AI震撼数学界:国际奥数大会上,陶哲轩表示“当前AI智能水平已接近人类”!

2024/9/3 16:47:04

添加下方童程童美老师? 获得少儿编程学习知识&信息最近,在...

添加下方 童程童美老师? 获得少儿编程学习知识&信息 

最近,在第65届国际数学奥林匹克(IMO)大会上,菲尔兹奖得主著名数学家陶哲轩的演讲为我们提供了一个深入了解AI在专业领域应用的窗口。有“数学界莫扎特”之称的陶哲轩,11岁时参加国际数学奥林匹克(IMO)获得了一枚铜牌。第二年,他获得了银牌。接着,13岁的他赢得了,成为当时*年轻的得主。14岁读大学,17岁进入普林斯顿大学读博,21岁博士毕业,24岁成为加州大学洛杉矶分校(UCLA)史上*年轻教授,31岁获得数学界最高奖项菲尔兹奖。

他认为虽然神经网络已经存在了20 年,AI技术其中以大型语言模型(LLMs)为代表也已经有大约 5 年的历史,但直到最近,AI输出才慢慢达到了人类的水平。陶哲轩指出,虽然AI暂时可能有点困难直接解决问题,但它能提供宝贵的见解,帮助研究者找到问题之间的联系,并指引深入研究的方向。这种辅助作用不仅体现在数学研究中,也反映了AI在各个领域的广泛应用潜力。例如GPT-4,展示了令人瞩目的能力。它们不仅能在某些复杂问题上表现出色,还能作为创意和灵感的来源。陶哲轩分享了自己使用AI辅助工具解决数学问题的经历,展示了AI如何为研究提供新的思路。这种人机协作的模式正在各个领域中得到应用,推动着创新和进步。然而,正如他所强调的,我们仍然需要保持对传统方法的掌握。只有深入理解问题本质,我们才能有效地利用和指导AI。这一观点不仅适用于数学研究,也适用于我们与AI互动的所有领域。

AI技术的不断进步为无论是专业领域和日常生活中的我们带来无限可能。当前首要任务是学会如何*佳地利用这些工具,在人机协作中找到平衡,为我们自己创造更美好的未来。(以下选自本次演讲内容)01.机器与数学的历史今天我的演讲主题是人工智能,更广泛来说,是机器如何辅助数学。你们可能都听说过人工智能,知道它正在改变一切。事实上,我们很久以前就已经开始使用计算机和机器来进行数学计算了,只是使用的方式在变化,但这实际上是延续了一种机器辅助的悠久传统。那么问题来了:我们使用机器来进行数学计算有多久了?答案是:几千年。这里展示的是古罗马人用来进行数学计算的机器。算盘是最早的机器之一,甚至还有一些更早的。当然,这些机器看起来比较简单,不算特别“智能”。那么计算机呢?我们使用计算机进行数学计算又有多长时间了?大约有300到400年了。这听起来有些奇怪,因为我们的现代电子计算机直到1930年代和1940年代才出现。但计算机并不总是电子的。在此之前,它们是机械的,再往前则是人工操作的。“计算机”其实是一种职业——指的是那些专门从事计算工作的人。这里展示的是二战期间的“计算机”团队,她们大多数是女性,因为当时男性都在前线作战。她们使用加法机进行计算,程序员负责指挥她们的工作。那时计算的基本单位不是 CPU,而是“kilo-girl”——即1000名女性工作一小时的计算量。事实上,我们使用计算机的历史可以追溯到更早的时期,至少从18世纪开始,甚至更早。那时,计算机的*基本用途是制作表格。你可能听说过 Napier 的对数表。如果你需要计算正弦或余弦等函数值,就要使用计算机生成这些表格。我在上高中的时候,课程中还教我们如何使用这些表格,只不过这些表格已经逐渐被淘汰了。如今我们有了计算器和计算机。即使在今天,我们仍然使用表格。在数学研究中,我们依赖表格——现在我们称之为数据库,但本质上它们还是表格。许多数学的重要发现最初都是通过表格得出的。在数论中,一个*基本的结果被称为素数定理。它大致描述了某个大数 X 之前存在多少素数。这个定理是由 Legendre 和 Gauss 发现的。尽管他们无法证明这一结果,但他们通过计算机生成了前一百万个素数的表格,并通过这些数据找到了规律。我们最早使用计算机的方式之一就是利用表格。提到使用计算机进行数学计算,通常想到的就是数值运算。这个正式的名称叫做科学计算。当你需要进行大量的计算时,只需交给计算机来完成。自 1920 年代以来,我们一直在做这件事。可能第*个真正进行科学计算的人是 Hendrik Lorentz。他受荷兰政府委托研究如何建造一个巨型堤坝,他们需要预测水流的变化,于是不得不模拟流体方程。他动用了大量“人力计算机”来完成这项工作,并发明了浮点运算。他意识到,如果要让大量的人快速完成大量计算,使用浮点数来表示不同数量级的数值是非常有效的。如今,我们用计算机来模拟各种现象。如果你要解大量线性方程组或偏微分方程,或者做一些组合计算,你同样可以解决代数问题。原则上,许多奥数竞赛中的几何问题都可以通过科学计算解决。你可以将任何涉及 10 个点、一些直线和圆的几何问题转化为一个包含 20 个未知数的方程组,然后输入到 Sage 或 Maple 这类工具中进行计算。不幸的是,一旦问题的规模超过一定程度,计算的复杂度就会急剧增加,甚至呈现双指数级增长。所以直到最近,用标准的计算机代数软件来硬解这些问题仍然不太可行,但现在有了 AI 辅助,这种方式可能会更有效。02.证明助手对数学研究的影响近年来,我们开始以更具创造性的方式使用计算机。我认为有三种计算机辅助数学的方法特别令人兴奋,尤其是当它们与其他工具结合使用时,比如传统的数据库、表格、符号计算和科学计算。首先,我们正在使用机器学习神经网络来发现新的数学关联,揭示出人类难以察觉的数学领域之间的关系。*引人注目的当属大型语言模型,它们从某种意义上说是非常庞大的机器学习算法,可以处理自然语言——比如 ChatGPT 和 Claude 等工具。有时它们能提出可能的解题方法,有时有效,有时无效。你可以在我演讲之后的讲座中看到更多这样的例子。还有一种刚刚开始被普通数学家使用的技术,叫做形式证明助手。这些工具类似于编程语言,但用于验证某个推论是否正确,能否从已知数据中得出结论。直到最近,这些工具还相当难用,但现在它们变得相对容易使用,并推动了一些有趣的数学项目,这些项目在没有这些证明助手的情况下是无法完成的。未来它们将与我今天提到的其他工具很好地结合使用。Lean 是近年来得到大量发展的语言之一,它的特点是有一个由众多数学家共同开发的庞大数学库。与从数学公理推导一切相比——随着研究深入,这变得非常繁琐——Lean 的数学库已经包含了许多中间结果,例如你在本科数学课程中会学到的内容,比如微积分、群论或拓扑学的基本定理等。这些内容已经被形式化,因此现在有了一个现成的基础——研究不再是从公理开始,而是从研究生水平的数学教育开始。虽然离目标还有不小的差距,但这已经是一个很大的帮助。但为了形式化这个定理,他们不得不添加许多额外的内容。数学库尚未完全完善——实际上,它仍然不完整。还有许多数学领域,如同调代数、层理论、拓扑理论等,需要被添加到库中。但仅用了 18 个月,他们就成功将这个定理形式化。证明基本上是正确的。虽然存在一些小的技术问题,但并没有发现什么大的问题。他们还找到了一些更简洁的证明方法。有些技术步骤实在过于复杂,难以形式化,因此他们不得不寻求一些捷径。不过,这个项目的真正价值更多体现在间接影响上。首先,他们大大扩展了 Lean 的数学库。现在,这个数学库能够处理更广泛的抽象代数问题,比以往更为强大。03.大型语言模型与数学虽然神经网络已经存在了 20 年,大型语言模型也已经有大约 5 年的历史,但直到最近,它们的输出才达到了接近人类的水平。你们可能都听说过 GPT-4,这就是当前 ChatGPT 所使用的模型。当 GPT-4 发布时,有一篇论文描述了它的能力,研究人员向它提供了一个 2022 年国际数学奥林匹克(IMO)的题目。虽然这个题目是稍微简化过的版本——如果你熟悉 2022 年的 IMO,你可能会注意到它的形式与原题有所不同,但问题的本质是相同的。对于这个题目,GPT-4 实际上给出了一个完整且正确的解答,成功地解决了这个 IMO 题目。然而,这其实是一个精心挑选的例子。研究人员测试了数百个 IMO 水平的问题,成功*大约只有 1%。所以他们能够解决这个特定的问题,并且需要以特定的方式格式化问题才能得到正确的答案,但这依然非常令人惊叹。有趣的是,这些工具在处理人类觉得难的问题时,有时表现得非常出色,但在人类认为简单的问题上,AI 却经常犯错。它的解决问题方式与人类非常不同。在同一篇论文或演讲中,他们让同一个模型进行一个简单的算术计算:7 * 4 + 8 * 8。模型根据输入猜测*有可能的输出,得出了答案是 120。然后它停顿了一下,说“也许我应该解释一下为什么答案是 120。”于是它开始一步步计算,结果得出了实际的答案是 92,而不是最初的 120。如果你质疑它“等等,你之前说是 120”,它会回答“哦,那是个错误,抱歉,正确答案是 92。”所以你可以看到,AI 并不是从基本原理出发来解决问题的,而是在每一步中猜测下一个*自然的输出。令人惊讶的是,有时这种方法奏效,但很多时候并不奏效。如何让它变得更准确,目前还在不断探索中。人们正在尝试各种方法。你可以将这些模型与其他更可靠的软件连接起来。事实上,在接下来的演讲中,你会看到一个大型语言模型的例子,在这个例子中,你不需要自己进行计算,而是将其交给 Python 来完成。另一种方法是强制语言模型只能生成正确的答案,方法是要求模型以某种证明助手语言输出,如果它无法编译,就返回给 AI 重新尝试。或者,你可以尝试直接教它解决 IMO 问题的常用技巧——比如尝试简单例子、反证法证明、逐步推导等。人们正在尝试各种方法。虽然目前它还远不能解决大多数数学奥林匹克问题,更不用说数学研究问题了,但我们正在取得进展。除了能够直接解决问题外,语言模型作为灵感来源也是有用的。实际上,我自己也使用过这些模型。我在处理某个组合数学问题时尝试了几种方法,都没有成功。于是,我作为实验问 GPT“你会建议哪些其他技术来解决这个问题?”它给了我一份包含 10 种技术的列表,其中 5 种我已经尝试过,或者显然不适用。但有一种技术我没有想到,那就是针对这个特定问题使用生成函数。当它提出这个建议后,我意识到这确实是正确的方法,但之前我忽略了。所以,作为一个交流的对象,这种模型是有一定帮助的。虽然现在它还不是特别强大,但也并非毫无用处。还有一种 AI 辅助工具在证明助手领域变得非常实用。正如我之前提到的,编写形式化证明是一项非常繁琐的工作。就像使用任何严苛的编程语言一样——你必须完全正确地使用语法,如果错过了某个步骤,代码就无法编译成功。不过,现在有一些工具——比如我使用了 GitHub Copilot,你可以先写出部分证明,它会尝试猜测下一行代码的内容。大约有 20% 的时间,它的猜测会比较接近正确,然后你可以选择接受它的建议继续进行。在这个例子中,我试图证明某个陈述,灰色部分是 Copilot 建议的代码。结果显示,第*行没有用,但第二行(虽然你可能看不到)实际上解决了这个问题。所以,你不能盲目接受 Copilot 的建议,因为它的输出不一定总是正确的。但如果你已经大致了解代码的工作原理,这个工具确实可以节省你很多时间。这些工具在不断进步。目前,如果一个证明只有一两行长,它们可以自动填充。现在也有一些实验,试图让 AI 提出一个证明,然后将其反馈给编译器。如果编译不通过,你就把错误信息返回给 AI,让它重新尝试。通过这种方法,我们已经能够证明一些四到五行长的证明。当然,对于大的证明,通常会有成千上万行代码,所以目前我们还远未达到可以立即自动形式化证明的地步。但这已经是一个非常有用的工具了。那么,我们现在处于什么阶段呢?有些人希望在未来几年内,我们能够使用计算机直接解决数学问题。我认为我们距离这一目标仍然很遥远。对于非常专门的问题,你可以设计特定的 AI 来处理,但即便如此,它们也不总是完全可靠的——尽管可以提供帮助,但仍有局限性。不过,至少在未来几年里,这些工具将成为非常有用的助手,超越我们目前熟悉的暴力计算辅助。人们正在尝试各种创造性的方式。我特别感兴趣的一个方向虽然还没有取得显著成功,但未来 AI 可能会非常擅长生成有价值的猜想。我们已经在结论中看到了一些初步的例子,AI 能够猜测两个不同统计量之间的关系。所以,希望将来你可以创建庞大的数据集并将其输入 AI,然后 AI 可以自动生成许多不同数学对象之间的联系。我们目前还不完全知道如何实现这一点,部分原因是缺乏足够庞大的数据集,但我认为这是未来可能实现的目标。我还对另一种可能性感到兴奋——这是目前还不存在的一种数学研究方式。现在,由于证明定理是一个如此繁琐且耗时的过程,我们通常一次只能证明一个定理,或者如果效率高的话,可能证明两三个定理。但随着 AI 的进步,你可以想象在未来,不再只是解决一个问题或证明一个定理,而是处理一类有 1,000 个类似问题的集合。你可以对 AI 说,“好吧,尝试用这种技术解决这 1,000 个问题。”然后 AI 会给你反馈:“用这个技术我可以解决 35% 的问题。用另一个技术呢?可以解决多少?”如果结合两种技术,可能解决的比例又会增加。你可以开始探索问题的整体空间,而不再是逐一解决每个问题。这种方式在现在几乎是不可能实现的,或者需要几十年时间,通过大量论文逐步摸索出各种技术的应用范围。但有了这些工具,你将能够在一个前所未有的规模上进行数学研究。因此,我认为未来会非常激动人心。我是说,我们依然会以传统的方式证明定理。事实上,我们必须这样做,因为如果我们自己不掌握这些技能,就无法有效引导 AI。然而,我们将能够实现许多当前无法完成的事情。源自AI深度研究员,版权属于原作者,仅用于学术分享.END.干货分享、学习规划编程学习资料、赛事指南欢迎扫码1V1咨询??????

▼往期精彩回顾▼ 点击下方图片即可查看 

高智商的父母,从不和孩子讲道理,而是“非暴力沟通”

为什么过度自信的孩子,更容易被时代淘汰?

戳“阅读原文”报名免费体验课

“海口童程童美”是北京童程童美科技有限公司在教育宝平台开设的店铺,若该店铺内信息涉嫌虚假或违法,请点击这里向教育宝反馈,我们将及时进行处理。

机构评分

环境:4.0师资:4.0服务:4.0效果:4.0

公示信息

店铺名称:海口童程童美

单位名称:北京童程童美科技有限公司

账号名称:hktctm(189******32)

所属城市:海南海口

入驻时长:11年

在线客服:在线聊

微信咨询

返回顶部