91精品色婷,日韩少妇中出,国产 精一区二区三,欧美视频精品在线二区,婷婷久久日韩欧美,亚洲天堂性爱视频,亚洲香蕉一区,国产自产观看精品一区,日本 大胆成人

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

谷歌 AI 框架 AlphaProof Nexus 攻克 2 道懸置 56 年數(shù)學(xué)難題

2026/5/26 12:54:06 來源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 5 月 26 日消息,谷歌 DeepMind 最新推出 AlphaProof Nexus,結(jié)合大語言模型(LLM)生成證明與 Lean 形式化驗證,在 353 個開放的 Erd?s 問題中自主解決 9 個,并解開 2 個懸而未決 56 年的問題。

IT之家注:Lean 是一種形式化證明語言和證明助手系統(tǒng)。研究者可以把數(shù)學(xué)命題、定義和證明步驟寫成嚴(yán)格可檢查的代碼,編譯器會逐步判斷每一步是否合法。

Erd?s 問題(Erd?s problems)是由 20 世紀(jì)最高產(chǎn)的匈牙利數(shù)學(xué)家保羅 · 埃爾德什(Paul Erd?s)提出的一系列數(shù)學(xué)猜想和問題,涵蓋組合數(shù)學(xué)、數(shù)論、圖論和幾何等領(lǐng)域。

根據(jù)谷歌論文內(nèi)容,AlphaProof Nexus 在 353 個開放的 Erd?s 問題中解決了 9 個,其中 2 個問題已懸而未決 56 年。

Six charts plotting solve rate (Y-axis) against mean cost in USD (X-axis) for Erd?s problems 12(i), 12(ii), 125, 138, 152, and 26. Four agent variants are color-coded: (A) basic in blue, (B) basic with AlphaProof in orange, (C) basic with evolution in green, and (D) full in red. Numbers at data points indicate the number of sub-agents. On easier problems, all variants converge at high solve rates; on harder problems like erdos_125, solve rates stay low overall but rise with more sub-agents and higher cost.

AlphaProof Nexus 還在 OEIS(整數(shù)序列在線百科全書)的 492 個開放猜想中證明了 44 個,解決 1 個存在 15 年的 Hilbert 函數(shù)問題,并改進了凸優(yōu)化中的已知界限。每個問題的推理成本只要數(shù)百美元。

在架構(gòu)方面,AlphaProof Nexus 由 4 個復(fù)雜度遞增的 AI 智能體組成:

  • Agent A 只依賴 Gemini 3.1 Pro 與 Lean 編譯器循環(huán)交互。

  • Agent B 接入 AlphaProof,補全缺失證明片段。

  • Agent C 加入類似 AlphaEvolve 的進化機制,讓多個證明草稿共享、評分、排序。

  • 功能最完整的 Agent D 則整合了上述能力。

原本用于攻克 Erd?s 問題的是 Agent D,但研究者發(fā)現(xiàn),最簡單的 Agent A 其實也能證明這 9 個已解問題,只是在最難題目上花費更高。

Three-column diagram showing AlphaProof Nexus's proof process for Erd?s problem #125: on the left, the Lean input file with EVOLVE-BLOCK markers and a sorry placeholder; in the center, the prompt with prior attempts, Elo ratings, and the current plan; on the right, the step-by-step proof with chain-of-thought reasoning, search-replace operations, AlphaProof calls, and final validation of all six sub-goals.

研究團隊認(rèn)為,這反映出 2 點變化:底層模型能力持續(xù)提升,以及編譯器反饋對 LLM 推理的“錨定”作用越來越強。

IT之家附上參考地址

相關(guān)閱讀:

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AI,OpenAI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知

巨野县| 博爱县| 济源市| 道孚县| 渭源县| 斗六市| 小金县| 长治县| 侯马市| 八宿县| 凤山市| 广东省| 于都县| 府谷县| 太和县| 奈曼旗| 东台市| 年辖:市辖区| 巨野县| 云霄县| 承德县| 清苑县| 宁南县| 乐至县| 昭平县| 永兴县| 馆陶县| 石棉县| 大同县| 卢龙县| 治县。| 北京市| 南陵县| 繁峙县| 夏河县| 新源县| 惠州市| 大宁县| 吴旗县| 阳高县| 宝应县|