谷歌AlphaGeometry2攻克IMO几何难题,已超越金牌得主平均水准

-
论文标题:Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2 -
论文链接:https://arxiv.org/pdf/2502.03544
-
扩展领域语言:涵盖轨迹型定理、线性方程和非构造性问题陈述; -
更强更快的符号引擎:优化了规则集,增加了对二重点的处理,以及更快的 C++ 实现; -
先进新颖的搜索算法:利用知识共享的多搜索树; -
增强的语言模型:利用 Gemini 架构在更大和更多样化的数据集上进行训练。
-
处理二重点(double ponit)的能力; -
更快的算法; -
更快的实现。
-
构造一个新点𝑋′作为 𝑎,𝜔 的交点(不知道 𝑋′ 是否与 𝑋 重合)。这是一个辅助构造,必须由语言模型预测; -
证明𝑋位于𝑏上; -
由于𝑋和𝑋′都位于𝑎,𝑏上,得出𝑋 = 𝑋′; -
因此𝑋位于𝜔上。

-
候选搜索步骤,它的时间复杂度是点数的多项式; -
子句匹配步骤,它的时间复杂度是每个前提的子句数的指数。

-
探索两倍大小的随机图,从而提取更复杂的问题; -
生成的定理复杂了两倍,即点和前提的数量; -
生成的证明复杂了 10 倍,即证明步骤多 10 倍; -
问题类型之间的数据分布更均衡; -
有无辅助点的问题之间的数据分布更均衡。




-
𝑆_1:给定原始问题前提,DDAR 可推导出的事实集; -
𝑆_2:给定原始问题前提并假设目标谓词也为真,DDAR 可推导出的事实集; -
𝑆_3:数字正确的事实集(检查图表)。



