滚球新闻

滚球新闻

滚球app 澳洲放羊大叔引爆 AI 编程改进!Claude Code 急推 goal 模式,不干完不许停

发布日期:2026-05-13 14:56 来源:未知 作者:admin 浏览次数:

滚球app 澳洲放羊大叔引爆 AI 编程改进!Claude Code 急推 goal 模式,不干完不许停

澳洲牧羊大叔顺手写的三行 bash,11 天内被 OpenAI、Anthropic 和 Hermes 集体收编了。

一醒觉来,Claude Code 又更新!

为了让 Claude 执续职责直到任务完成,Claude Code 最近推出的新功能:/goal 。

你惟有设定条目,Claude 不完成任务它毫不截止!

伸开剩余90%

用过 AI 编程器具的东说念主皆懂,这到底多迫切!

你给 Agent 下了一个任务,它跑了三个回合,改了两个文献,霎时停驻来问你「接下来需要我作念什么?」

不是,bug 你这还没修完呢啊!

Agent 越来越机灵,写代码越来越快,但「重新到尾把一件事干完」这件事,到 2026 岁首皆莫得一家能作念到。

然后,一位来自澳大利亚的牧羊大叔 Geoffrey Huntley,用三行 bash 搞定了。

while :; do cat PROMPT.md | claude-code --continuedone

他把它定名为 Ralph Loop,致意《辛普森一家》里阿谁经久搞不清现象但从不毁灭的小孩 Ralph Wiggum。

逻辑极其凶残,无穷轮回,反复把合并个 prompt 喂给 Agent。经过写在文献系统和 Git 历史里,高下文满了就开新实例,读文献接着干。

原始,不优雅,但超越灵验。

灵验到 OpenAI 看见了,Nous Research 看见了,Anthropic 也看见了。

11 天,三家顶级 AI 实验室,不谋而合地把这三行 bash 写进了官方居品。

这一刻,系数东说念主皆赫然了一件事 ——

通用东说念主工智能的临门一脚,可能不是更机灵的模子,而是「把事作念完」的模子。

换句话说,AI 编程的中枢战场正在从「生成代码」转向「闭环请托」。

11 天,三条线,合并个很是

4 月 30 日,OpenAI 的 Codex 领先上线 / goal。

Greg Brockman 在 X 上只丢了一句,开云体育(中国)官方网站「Codex 现已内置 Ralph loop++」。

一周后,Hermes Agent 跟上。又过 4 天,Claude Code 也上了。

11 天。三家。合并个敕令。合并个功能。

但竣事旅途,差了十万八沉。

Codex「不忘事」,Hermes「不烂尾」,Claude Code「不自欺」。

Codex:把蓄意存成一条数据库纪录

OpenAI 是三家里起始伊始的,有蓄意也最简约。

在 Codex 里,/goal 是一个执久化的职责流对象,存在土产货的 app-server 状态层里。

关掉末端、合上札记本、以致重启系统,蓄意皆不会丢。下次大开 Codex,自动接上。

模子通过结构化的 update_goal 器具禀报经过状态,token 预算消耗时触发「软着陆」而非硬停。

有东说念主用这个功能连结跑了 14 个小时,中间暂停 5 小时去就寝,转头 Codex 从断点续跑,把一个确立驱动神态作念罢了。

工程化,干净,但克制。

Hermes Agent:一个东说念骨干不完,滚球(中国)app官网那就上一个团队

Hermes Agent 的贪心最大。

在这里,/goal 仅仅冰山一角。确切的重头戏是多智能体看板系统,Hermes 把「让 AI 把活干完」从单 Agent 问题升级成了团队联接问题。

看板的底层是土产货 SQLite,执久化存储,跨重启不丢。

你在上头创建一个任务卡片,Hermes 会平直把它拆成多个子任务,分拨给不同的 Agent worker。每个 worker 是一个平稳的 OS 经过,有我方的身份、模子设立和职责目次。

看板和 / goal 是两套互补的系统。/goal 管的是单个 Agent 的蓄意锁定(Ralph loop),看板管的是多个 Agent 之间的任务疏通。一个纵向潜入,一个横向铺开。

临了,是五层防烂尾机制。

第一层,心跳检测。每个 worker 按期向看板报到,诠释我方还谢世。

第二层,僵尸回收。worker 超时没反馈?系统自动判定厌世,回收它手上的任务从新分拨。macOS 上还有特意的达尔文僵尸检测逻辑。

第三层,退出箝制。worker 没完成任务就退出了?系统自动把它标记为 blocked,不让它再接新活,留心「摸鱼型 Agent」反复领任务又不作念。

ag最新app下载官方网站

第四层,幻觉箝制。这是最狠的一层。AI 说「我作念罢了」不算数,系统会考据它施行产出的代码是否的确落盘了。Agent 说我方创建了一个文献但施行上莫得?收拢,回滚,重来。

第五层,重试预算。每个任务有平稳的 max_retries,最多重试 N 次,跨越就上报东说念主类。全皆不会无穷轮回到死机。

Claude Code:作念事的东说念主和验收的东说念主,不可是合并个

Anthropic 是三家里临了伊始的,但有蓄意最高明。

本色上,Claude Code 的 / goal 是一个 session 级别的 Stop Hook。

你设定一个完成条目(比如「test / auth 目次下系数测试通过且 lint 无报错」),Claude 就开动干活。

要道想象在验收才调。每干完一轮,系统不让 Claude 我方判断「我作念罢了莫得」。

它把对话纪录和你的完成条目通盘发给一个平稳的小模子(默许是 Haiku),让这个小模子来裁判。

小模子淌若合计没完成,就需要复返一个具体事理(比如「test_login.py还有 2 个 failure」)。然后这个事融会被注入 Claude 下一轮的高下文,领导它接着干。

淌若小模子认为完成了,蓄意就会自动撤销,任务结尾。

值得一提的是,这个裁判模子不调用任何器具,不读文献,不跑敕令。它只看 Claude 在对话里产出的内容。

是以,你的完成条目必须是 Claude 在对话中能诠释的东西。

它最长营救 4000 字符,因此你不错写得很细。

以致,还不错在条目里加不断,比如「不修改其他测试文献」「20 轮内完成不然罢手」等等。

决赛进行时:职责流进口

把视角拉远一步。

Claude Code 背后站着 Anthropic,Codex 背后站着 OpenAI,Hermes Agent 接入了双方的模子,同期亦然 DeepSeek V4 等模子的主力分发渠说念。

三条旅途,碰巧隐敝了 ASI 决赛的三个生态进口。

而他们争的,亦然合并样东西 —— 职责流。

谁的 Agent 先让路发者养成「设完蓄意就走开」的民俗,谁就锁死了职责流进口。

因为民俗一朝酿成,移动老本是指数级的。

你不会疏忽离开一个还是跑通了看板疏通、断点续传、checkpoint 回滚的 Agent 基础步伐。

一个看似很小的 / goal 敕令,背后卡的是整条 Agent 职责流的护城河。

参考贵府:

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog滚球app

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog

发布于:山东省