任丘市奥力斯涂料厂
绵阳防火门胶 留给人类数学的悬赏不多了!谷歌DeepMind口气解决9道埃尔德什问题
联系奥力斯
联系奥力斯

绵阳防火门胶 留给人类数学的悬赏不多了!谷歌DeepMind口气解决9道埃尔德什问题

PVC管道管件粘结胶

AI 进军数学界的速度太快了绵阳防火门胶。

OpenAI 前脚刚用内部模型突破埃尔德什的 80 年单位距离问题,谷歌 DeepMind 后脚就解决个同样卡了人类56 年的埃尔德什数学难题——

新发布AlphaProof Nexus,套由 Gemini 驱动的智能体框架,出手就是9 个埃尔德什开放问题

除了这 9 道,它还顺手证明了 OEIS 整数序列百科里的 44 个猜想、搞定了道搁置 15 年的代数几何难题、还改进了凸优化域里个沿用已久的理论边界。

理成本呢?每道题几百美元,整套证明代码也全都开源放在了 GitHub 上。

这篇论文共有 20 位作者,其中的Aja Huang,也是 2016 年AlphaGo的核心研究员。

56 年没人做出来的题,AI 给了什么答案

AlphaProof Nexus 解决的这几道题,咱挑三道有意思的说说。

Erd ő s  ,1970 年提出,悬置 56 年

这道题问的是:你能不能找出个限大的整数集,满足两个听起来很别扭的条件:

,任意从中挑三个不同的数字 a、b、c,a 永远不能整除 b 加 c 的和。

二,这组数不能太散,在自然数里要保持定的密度。

简单理解就是,这群数字之间,既不能个数整除另个数,也不能个数整除另外两个数的和,同时数字还要分布得相对密集,不能只挑寥寥几个数投机取巧。

从 1970 年开始,就没人能给出这个集的完整构造,各种局部进展有,但始终拼不成个整体解。

AI 的解法是用剩余定理把大问题拆成许多个立的区块,每个区块内部用三项等差数列的回避集来满足约束,然后把所有区块拼回个完整的限集。

Erd ő s  ,1996 年提出,30 年没有定论

这道题听着就奇怪了。

想象两个数字集:个集里全是"在三进制下只由数字 0 和 1 组成的整数",二个集里全是"在四进制下只由数字 0 和 1 组成的整数"。把这两个集里所有数字两两相加绵阳防火门胶,得到个新集。

问:这个新集里的数字在自然数中出现的频率(数学上叫下密度)是不是正的?

直觉上你可能会觉得,两种集包含的数字本来就不很多,加起来应该也挺稀疏的。

但稀疏到什么程度?是稀到密度归,还是多少保持点正密度?

这中间的差别非常微妙,1996 年提出后直没定论。

AI 的答案是:密度为。

证明思路是 log ₄除以 log ₃是理数。这意味着 3 的幂次和 4 的幂次可以以任意精度彼此逼近。

利用这点,AI 构造了个归纳稀疏化论证:不断找到两个几乎对齐的尺度,让密度以 0.99 的比率步步衰减,直到归。

个纯数论的质,解决了个组几何的问题。

Erd ő s  ,1992 年提出,卡了人类 34 年。

这是个平面几何题,AI 证明了存在这样个限扩展的平面点集:

你从中任意挑出有限个点,总能发现其中大部分点是不共线的——

随便截段,看起来都挺正常,但当你试图把这个限集拆分成有限个"对没有任何三点共线"的子集时,办不到。

个集的每个有限局部都正常,但整体顽固得不可拆分。这种全局与局部的张力,是组几何里难的那类问题。

AI 把图的每条边映射到平面上个点,用二次多项式编码坐标,再拉上穷 Ramsey 定理完成证明,把个几何问题翻译成了图论和逻辑的语言。

除了这三道,还有六道分别在整除集构造、范德瓦尔登数间隙、西顿集孤立点、集拆分密度等域。

同时,万能胶生产厂家AlphaProof Nexus 还在 OEIS 整数序列百科里证明了 44 个开放猜想,在代数几何那边解决了道希尔伯特函数对数凹的 15 年悬案,凸优化那边改进了个锚定梯度下降法的理论边界。

菲尔兹得主陶哲轩曾经提醒过,AI 目前解决埃尔德什问题的实际成功率大约在 1-2,这次谷歌的系统挑战了 353 道题,解开 9 道,比例刚好对上了。

用几百美元力换道 56 年难题绵阳防火门胶

AlphaProof Nexus 的架构核心用句话就能说清楚,Gemini 3.1 Pro 生成 Lean 语言证明步骤→ Lean 编译器逐行检查→报错直接反馈给模型→模型根据报错修改→再检查→循环到全部通过。

好伙,这有点像平时写代码,只不过现在 Debug 的是数学定理……

在这套框架里,DeepMind 设计了四个 Agent。

简单的 Agent A是同时启动多个立子 Agent,先靠 Gemini 3.1 Pro 梳理解题思路,动手编写证明代码。

写完立刻交给编译器核验,旦报错,错误信息就会传回模型,让它不断修改、重试,直到通关。

全程没有额外辅助工具,纯靠写代码 + 查错循环。

Agent B 多了样东西,AlphaProof。

AlphaProof 是 DeepMind 之前门为奥数别题目训练过的强化学习证明工具。

当 Agent A 模式在某个小步骤上反复卡住、编译器反复报错也修不过来时,Agent B 可以调用 AlphaProof 做次强化学习驱动的树搜索,门攻击这个局部难点。

Agent C 引入了进化法的思路。

前面两种 Agent 的子 Agent 都是各自立工作的,互不交流。

Agent C 是所有子 Agent 共享个证明草图种群,每个子模块都会产出不同的证明草稿。

然后由另个模型从理、清晰度、新颖三个维度给每份草稿分,用 Elo 评分系统排名。

分草稿会相互组,衍生出新解法,低分草稿直接淘汰,整个种群在证明空间里做进化搜索。

Agent D 是全体,进化筛选思路 + 项工具攻克难点 + 大模型逻辑理,三股力量在个框架里协同,也是这次批量破解难题的主力。

这么看下来,我以为强的 Agent D 应该会碾压切,Agent A 只当个对照组。

结果没想到论文里表明简单的 Agent A,同样能解出全部 9 道题。

没有进化法,没有 AlphaProof,就个 LLM 循环加编译器反馈的 Agent A,只是在难题上费钱点。

奥力斯    PVC管道管件粘结胶价格     联系人:王经理    手机:18231788377(微信同号)    地址:河北省任丘市北辛庄乡南代河工业区/p>

研究团队把原因归为两个:

是 Gemini 3.1 Pro 本身的能力已经足够强了;

二是 Lean 编译器的那层实实的纠错反馈,对 AI 的引作用,远比人们预想的大。

这个结果或许也在预示着,未来随着大模型能力持续升,复杂的多工具组系统,可能不再是刚需,只用大模型 + 业校验工具这套简单循环,就能搞定大多数数学难题。

而且这套案的优势也体现在成本上,单题仅需几百美元。

埃尔德什生前为这些难题设置了悬赏,只是他不会想到——

解开这些谜题的可能不是人类智慧,而是力。

论文地址:https://arxiv.org/abs/2605.22763v1

Github 地址:https://github.com/google-deepmind/alphaproof-nexus-results

参考链接:

[ 1 ] https://x.com/pushmeet/status/2058936037754224998

[ 2 ] https://the-decoder.com/google-deepminds-alphaproof-nexus-solves-decades-old-math-problems-for-a-few-hundred-dollars/

—  欢迎 AI 产品从业者共建  —

� �「AI 产品知识库」是量子位智库基于长期产品库追踪和用户行为数据出的飞书知识库,旨在成为 AI 行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。

键关注 � � 点亮星标

科技前沿进展每日见

相关词条:玻璃棉毡     塑料挤出机     预应力钢绞线    铁皮保温    万能胶生产厂家

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定绵阳防火门胶,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。