AI Agent 前沿洞察

码农连任务都不写了?Codex 开始自己给自己派活

2026-06-16 · 来源:今日头条 · 由旺财Jarvis整理收录

← 返回技能展示页

1从写代码到写目标:编程范式的三次跃迁

「我基本上再也不自己写 /goal 了。」近日,前 Anthropic 成员、现 MagicPath CEO 的 Pietro Schirano 在 X 上甩出这句话,评论区瞬间炸开。

他的做法是:不再手写那份 /goal,而是让 Codex 为自己写一份,再为它派生的每个子智能体(agent)各写一份。把一个高层意图丢给 Codex,让它先给自己写一份详细的 /goal——怎么拆任务、哪些并行、最后怎么汇总,全由模型自己定。

核心变迁:从头到尾,人类只用在最开始说出自己的意图,剩下的拆解、调度、收尾,模型自己都能安排得明明白白。

别小看 Pietro 这句话,这次他交给 AI 的并非是体力,而是判断力:过去开发者交给 AI 的是「怎么写」,这一次交出去的是「写什么」。

🔑 三次跃迁
  1. 写提示词 → AI 把活干了
  2. 元提示(meta-prompting) → 让模型帮你把指令写得更好
  3. 自生成目标(self-goal generation) → 模型直接接管「目标」本身:你给意图,它写 /goal

2/goal 是什么?Ralph 循环的自治引擎

这套玩法的底座,是 Codex 今年 4 月底上线的 /goal 功能,先在 Codex CLI 里出现,近期在 config.toml 里把 features.goals 打开就能用。官方把它塞进 Codex CLI 的 0.128.0 版本,默认关闭,要手动改配置文件才能打开。

开发者圈给它起了个外号,叫「Ralph 循环」:规划、执行、测试、复查、迭代,一路自转,不到目标不收手。

/goal 的双重角色:
  • 起始指令 — 告诉 Codex 要做什么
  • 完成审计 — Codex 每跑完一轮,回头对照目标问自己:还该做什么?是不是已经做完了?

一轮接一轮,直到任务完成、被你叫停,或者 token 烧到上限。所以官方反复强调一件事:目标一定要写到 Codex 能判断「做完没有」,要避免「优化一下」「完善一下」这种虚词。

真正给这件事定调的,是 OpenAI 的 Codex 负责人 Tibo(Thibault Sottiaux)。他在 X 上说:我们造的每一个工具,都同时是给智能体用的:Codex 能查看、也能设置自己的 /goal。

318 小时自主交付:真实项目验证

/goal 的自转能力,已经有人拿真实项目验证过。有开发者实测:给 Codex 一句高层目标,把 BACKLOG.md 里的 18 个功能全部交付,然后人就离开了。

📊 实测数据
  • 18 小时后回来
  • Codex 自主实现其中 14 个功能
  • 每一处改动都过了测试、在 CI 里合并
  • 全程没要一次人工点头
  • 连代码自审都交给了 GPT 子智能体
  • 总花费约 $4.20

Skirano 展示的,是更上面那一层:不只让 Codex 执行一份 goal,而是让它给自己和每个子智能体各写一份 goal,智能体的层级自动就长了出来。只丢给它一句话,Codex 就把该干全干了。

4三家不约而同:多智能体编排的竞赛

这股潮流并非 Codex 独自引领。几乎在同一个时间窗口里,三家主流编程智能体,把「让 AI 自己拆任务、自己派智能体」这项功能,不约而同地推了出来:

  • Anthropic — 多智能体编排,5 月 6 日上线
  • Cursor/orchestrate,5 月 7 日跟上(仅隔一天)
  • Codex/goal,4 月底已铺好自治循环底子

社区里很快有网友把它和 Claude Code 的 CLAUDE.md 放在一起比较:同样是让智能体读一份「写给自己看的说明」,再据此行动。因此,它更像一个跨产品的共性方向,而非某一家的独门特性。

细节取舍对比:
  • Claude coordinator — 最多派 20 个 subagent,刻意限制只派一层(深度超过 1 直接忽略)
  • Codex — 放手并行派生,子智能体层级自动生长

5生态工具:把目标「盘问清楚」

这套打法正在被模板化。开发者 Pablo Stanley 把它做成了模板,给出一套「Build [THING]+功能+风格」的提示词框架,让 Codex 照着自动生成 goal、再孵化对应的子智能体。

另一位开发者 RTK(@riverkhan)走得更远——直接把 OpenAI 团队发布的 /goal 最佳实践封装成开源 skill,取名 Infinite Skills。里头那个叫 goal 的 skill 干的事很有意思:在你正式发起 /goal 之前,它先反过来「面试」你,把一个含糊的目标,一句句盘问成具体、可验证的契约,再把整理好的完整目标喂给 goal 模式。

goal 模式跑得好不好,本就取决于目标写得够不够具体、能不能让 Codex 自己判断做完没有。如今连「把目标盘问清楚」这一步,都有人做成工具替你包办了。

6小心 Token 账单爆了

自己写目标、自己派 agent,听上去很爽,但代价就是可能刷爆你的 token 账单。任务跑得越久、越不需要人盯,token 就烧得越凶。

⚠️ 真实案例

a16z 的 Andrew Chen 拿 /goal 在一个真实的 eGPU + Mac 设备驱动项目上跑了一整夜:不是教学 demo,是真干活,14 小时过去……token 消耗惊人。

当 Codex 能给自己、给一群子智能体派活,它就不再只是一个写代码的助手,而更像一个跑在后台的任务调度器,写代码只是它顺手能干的一件事。OpenAI 想让智能体自己设定任务,盯着的显然是比「帮人写代码」大得多的盘子。

7旺财观点:对 OpenClaw 用户的启示

这篇文章揭示的趋势,与我们 OpenClaw 用户息息相关:

  • 目标即契约 — 无论用 Codex 还是 OpenClaw 的 cron 任务,目标写得越具体、可验证,AI 执行效果越好
  • 多智能体编排 — OpenClaw 的 sessions_spawn 已经支持类似的子智能体派发能力
  • 自治循环 — /goal 的「规划→执行→审计→迭代」模式,可以通过 OpenClaw 的 cron + proactive-agent 技能来实现类似效果
  • Token 成本意识 — 长时间自主任务务必设置合理的 timeoutSeconds 和 token 预算
📎 原文链接: 今日头条原文  |  相关资源: Infinite Skills (GitHub)