91精品色婷,日韩少妇中出,国产 精一区二区三,欧美视频精品在线二区,婷婷久久日韩欧美,亚洲天堂性爱视频,亚洲香蕉一区,国产自产观看精品一区,日本 大胆成人

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

澳洲放羊大叔引爆 AI 編程革命!Claude Code 急推 goal 模式,不干完不許停

新智元 2026/5/13 22:06:14 責(zé)編:清源
感謝IT之家網(wǎng)友 刺客、Domado 的線索投遞!

澳洲牧羊大叔隨手寫(xiě)的三行 bash,11 天內(nèi)被 OpenAI、Anthropic 和 Hermes 集體收編了。

一覺(jué)醒來(lái),Claude Code 又更新!

為了讓 Claude 持續(xù)工作直到任務(wù)完成,Claude Code 最近推出的新功能:/goal 。

你只要設(shè)定條件,Claude 不完成任務(wù)它絕不罷休!

用過(guò) AI 編程工具的人都懂,這到底多重要!

你給 Agent 下了一個(gè)任務(wù),它跑了三個(gè)回合,改了兩個(gè)文件,突然停下來(lái)問(wèn)你「接下來(lái)需要我做什么?」

不是,bug 你這還沒(méi)修完呢?。?/p>

Agent 越來(lái)越聰明,寫(xiě)代碼越來(lái)越快,但「從頭到尾把一件事干完」這件事,到 2026 年初都沒(méi)有一家能做到。

然后,一位來(lái)自澳大利亞的牧羊大叔 Geoffrey Huntley,用三行 bash 解決了。

while :; do  
cat PROMPT.md | claude-code --continue
done

他把它命名為 Ralph Loop,致敬《辛普森一家》里那個(gè)永遠(yuǎn)搞不清狀況但從不放棄的小孩 Ralph Wiggum。

邏輯極其粗暴,無(wú)限循環(huán),反復(fù)把同一個(gè) prompt 喂給 Agent。進(jìn)度寫(xiě)在文件系統(tǒng)和 Git 歷史里,上下文滿了就開(kāi)新實(shí)例,讀文件接著干。

原始,不優(yōu)雅,但十分有效。

有效到 OpenAI 看見(jiàn)了,Nous Research 看見(jiàn)了,Anthropic 也看見(jiàn)了。

11 天,三家頂級(jí) AI 實(shí)驗(yàn)室,不約而同地把這三行 bash 寫(xiě)進(jìn)了官方產(chǎn)品。

這一刻,所有人都明白了一件事 ——

通用人工智能的臨門(mén)一腳,可能不是更聰明的模型,而是「把事做完」的模型。

換句話說(shuō),AI 編程的核心戰(zhàn)場(chǎng)正在從「生成代碼」轉(zhuǎn)向「閉環(huán)交付」。

11 天,三條線,同一個(gè)終點(diǎn)

4 月 30 日,OpenAI 的 Codex 率先上線 / goal。

Greg Brockman 在 X 上只丟了一句,「Codex 現(xiàn)已內(nèi)置 Ralph loop++」。

一周后,Hermes Agent 跟上。又過(guò) 4 天,Claude Code 也上了。

11 天。三家。同一個(gè)命令。同一個(gè)功能。

但實(shí)現(xiàn)路徑,差了十萬(wàn)八千里。

Codex「不忘事」,Hermes「不爛尾」,Claude Code「不自欺」。

Codex:把目標(biāo)存成一條數(shù)據(jù)庫(kù)記錄

OpenAI 是三家里最先出手的,方案也最簡(jiǎn)潔。

在 Codex 里,/goal 是一個(gè)持久化的工作流對(duì)象,存在本地的 app-server 狀態(tài)層里。

關(guān)掉終端、合上筆記本、甚至重啟系統(tǒng),目標(biāo)都不會(huì)丟。下次打開(kāi) Codex,自動(dòng)接上。

模型通過(guò)結(jié)構(gòu)化的 update_goal 工具匯報(bào)進(jìn)度狀態(tài),token 預(yù)算耗盡時(shí)觸發(fā)「軟著陸」而非硬停。

有人用這個(gè)功能連續(xù)跑了 14 個(gè)小時(shí),中間暫停 5 小時(shí)去睡覺(jué),回來(lái) Codex 從斷點(diǎn)續(xù)跑,把一個(gè)設(shè)備驅(qū)動(dòng)項(xiàng)目做完了。

工程化,干凈,但克制。

Hermes Agent:一個(gè)人干不完,那就上一個(gè)團(tuán)隊(duì)

Hermes Agent 的野心最大。

在這里,/goal 只是冰山一角。真正的重頭戲是多智能體看板系統(tǒng),Hermes 把「讓 AI 把活干完」從單 Agent 問(wèn)題升級(jí)成了團(tuán)隊(duì)協(xié)作問(wèn)題。

看板的底層是本地 SQLite,持久化存儲(chǔ),跨重啟不丟。

你在上面創(chuàng)建一個(gè)任務(wù)卡片,Hermes 會(huì)直接把它拆成多個(gè)子任務(wù),分配給不同的 Agent worker。每個(gè) worker 是一個(gè)獨(dú)立的 OS 進(jìn)程,有自己的身份、模型配置和工作目錄。

看板和 / goal 是兩套互補(bǔ)的系統(tǒng)。/goal 管的是單個(gè) Agent 的目標(biāo)鎖定(Ralph loop),看板管的是多個(gè) Agent 之間的任務(wù)調(diào)度。一個(gè)縱向深入,一個(gè)橫向鋪開(kāi)。

最后,是五層防爛尾機(jī)制。

第一層,心跳檢測(cè)。每個(gè) worker 定期向看板報(bào)到,證明自己還活著。

第二層,僵尸回收。worker 超時(shí)沒(méi)響應(yīng)?系統(tǒng)自動(dòng)判定死亡,回收它手上的任務(wù)重新分配。macOS 上還有專門(mén)的達(dá)爾文僵尸檢測(cè)邏輯。

第三層,退出攔截。worker 沒(méi)完成任務(wù)就退出了?系統(tǒng)自動(dòng)把它標(biāo)記為 blocked,不讓它再接新活,防止「摸魚(yú)型 Agent」反復(fù)領(lǐng)任務(wù)又不做。

第四層,幻覺(jué)攔截。這是最狠的一層。AI 說(shuō)「我做完了」不算數(shù),系統(tǒng)會(huì)驗(yàn)證它實(shí)際產(chǎn)出的代碼是否真的落盤(pán)了。Agent 說(shuō)自己創(chuàng)建了一個(gè)文件但實(shí)際上沒(méi)有?抓住,回滾,重來(lái)。

第五層,重試預(yù)算。每個(gè)任務(wù)有獨(dú)立的 max_retries,最多重試 N 次,超過(guò)就上報(bào)人類。絕對(duì)不會(huì)無(wú)限循環(huán)到死機(jī)。

Claude Code:做事的人和驗(yàn)收的人,不能是同一個(gè)

Anthropic 是三家里最后出手的,但方案最巧妙。

本質(zhì)上,Claude Code 的 / goal 是一個(gè) session 級(jí)別的 Stop Hook。

你設(shè)定一個(gè)完成條件(比如「test / auth 目錄下所有測(cè)試通過(guò)且 lint 無(wú)報(bào)錯(cuò)」),Claude 就開(kāi)始干活。

關(guān)鍵設(shè)計(jì)在驗(yàn)收環(huán)節(jié)。每干完一輪,系統(tǒng)不讓 Claude 自己判斷「我做完了沒(méi)有」。

它把對(duì)話記錄和你的完成條件一起發(fā)給一個(gè)獨(dú)立的小模型(默認(rèn)是 Haiku),讓這個(gè)小模型來(lái)裁判。

小模型如果覺(jué)得沒(méi)完成,就需要返回一個(gè)具體理由(比如「test_login.py 還有 2 個(gè) failure」)。然后這個(gè)理由會(huì)被注入 Claude 下一輪的上下文,指導(dǎo)它接著干。

如果小模型認(rèn)為完成了,目標(biāo)就會(huì)自動(dòng)清除,任務(wù)結(jié)束。

值得一提的是,這個(gè)裁判模型不調(diào)用任何工具,不讀文件,不跑命令。它只看 Claude 在對(duì)話里產(chǎn)出的內(nèi)容。

所以,你的完成條件必須是 Claude 在對(duì)話中能證明的東西。

它最長(zhǎng)支持 4000 字符,因此你可以寫(xiě)得很細(xì)。

甚至,還可以在條件里加約束,比如「不修改其他測(cè)試文件」「20 輪內(nèi)完成否則停止」等等。

決賽進(jìn)行時(shí):工作流入口

把視角拉遠(yuǎn)一步。

Claude Code 背后站著 Anthropic,Codex 背后站著 OpenAI,Hermes Agent 接入了兩邊的模型,同時(shí)也是 DeepSeek V4 等模型的主力分發(fā)渠道。

三條路徑,恰好覆蓋了 ASI 決賽的三個(gè)生態(tài)入口。

而他們爭(zhēng)的,也是同一樣?xùn)|西 —— 工作流。

誰(shuí)的 Agent 先讓開(kāi)發(fā)者養(yǎng)成「設(shè)完目標(biāo)就走開(kāi)」的習(xí)慣,誰(shuí)就鎖死了工作流入口。

因?yàn)榱?xí)慣一旦形成,遷移成本是指數(shù)級(jí)的。

你不會(huì)輕易離開(kāi)一個(gè)已經(jīng)跑通了看板調(diào)度、斷點(diǎn)續(xù)傳、checkpoint 回滾的 Agent 基礎(chǔ)設(shè)施。

一個(gè)看似很小的 / goal 命令,背后卡的是整條 Agent 工作流的護(hù)城河。

參考資料:

  • https://code.claude.com/docs/en/goal

  • https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

  • https://github.com/anthropics/claude-code/releases/tag/v2.1.139

  • https://developers.openai.com/codex/changelog

本文來(lái)自微信公眾號(hào):新智元(ID:AI_era),作者:好困 KingZH

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,AI編程

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知

黎川县| 辽中县| 百色市| 曲阜市| 洮南市| 荥阳市| 封丘县| 平果县| 伊金霍洛旗| 德江县| 鲜城| 吉林省| 磐安县| 德惠市| 定西市| 炉霍县| 班戈县| 海口市| 和田县| 永定县| 益阳市| 西安市| 运城市| 万年县| 华阴市| 南宁市| 商南县| 会泽县| 遂川县| 阳春市| 收藏| 准格尔旗| 渑池县| 塔河县| 河曲县| 万宁市| 萨嘎县| 和静县| 衡阳县| 松江区| 临城县|