Loop Engineering 来了：游戏开发者如何用 AI 循环自动化重构工作流

发布于2026年6月16日作者:Okgogogo

2026 年 6 月初，Claude Code 的创造者 Boris Cherny 在 Acquired Unplugged 开发者大会上说了一句话：「我已经不给 Claude 写提示词了。我有一堆循环在跑，它们负责给 Claude 下指令、决定下一步做什么。我的工作，就是写循环。」几乎同一周，Google Cloud AI 总监 Addy Osmani 发布长文，正式将这种工作方式命名为 Loop Engineering（循环工程）。这不是又一个营销词汇——Claude Code 和 OpenAI Codex 都已在 2026 年 Q2 原生支持了循环所需的全套组件。对于游戏开发者而言，理解这一范式转变，可能比学习任何单个 AI 工具都更重要。

[[image:overview]]

从 Prompt 到 Loop：四次迭代到底在解决什么

过去三年，AI 工程方法论经历了四次迭代，每一次都对应着 AI 自主工作能力的跃迁。

Prompt Engineering（2023 年起）：AI 是一问一答的工具。你写提示词，它执行。核心技能是「把指令说清楚」——角色设定、少样本示例、思维链。在游戏开发中，这就像你告诉美术 AI「画一个暗黑风格的骑士角色，手持发光长剑，背景是废墟城堡」。

Context Engineering（2025 年中起）：AI 开始能连续干几十步，但会忘事。你需要管理它看到什么信息——RAG、MCP 工具调用、记忆机制。在 UE5 项目中，这意味着让 AI 理解你的项目结构、材质命名规范、蓝图组织方式，而不是每次都从零开始。

Harness Engineering（2026 年 2 月起）：AI 能干几个小时的大活了。你需要给它搭完整的工作环境——项目规范文档（如 CLAUDE.md）、验证钩子、权限约束。HashiCorp 联合创始人 Mitchell Hashimoto 提出的核心思想是：每当 Agent 犯错，不要改提示词，而是改造它的运行环境，让这个错误在结构上不可能再发生。

Loop Engineering（2026 年 6 月起）：AI 能连续干几天了，还能同时开几十个实例并行。你需要一套自动调度系统——什么时候启动 Agent、干完谁来检查、检查不过怎么重试、记录存在哪、什么时候收工。人彻底退出执行环节，只保留设计权和验收权。

这条演进线的底层变量只有一个：AI 能连续自主工作的时间长度。从一问一答，到几十步，到几小时，到几天。人的角色同步上移：提问者、信息管理者、环境搭建者、系统设计师。

一个循环由什么构成

按 Osmani 的拆解，一个完整的 Loop 由五个核心构件组成：

目标条件（Goal）：什么算干完？不是「尽量做好」，而是「所有测试通过且 lint 无报错」这种可被机器验证的条件。Claude Code 提供 /goal 命令，Codex 提供 automation 原生支持。判断「算不算完成」的，是一个独立的小模型，而不是写代码的 Agent 自己——就像考试不能自己批卷。

技能系统（Skills）：解决「每开一个新会话都要从头介绍项目」的问题。本质上是一个结构化文件夹，存放项目约定、构建步骤、历史踩坑记录。在 UE5 项目中，这可能包含：蓝图命名规范、材质层叠规则、PCG 节点配置标准、打包发布流程。写一次，Agent 每轮运行都读得到。

子 Agent 分工：写代码的 Agent 给自己打分手太松。换一个指令不同、甚至模型不同的第二个 Agent 来审，能逮住第一个说服自己忽略的问题。常见分工是：探索 Agent → 实现 Agent → 验证 Agent。这和游戏团队里「开发不能自测」是同一个原理。

连接器（Connectors）：基于 MCP 协议的连接器让循环能读问题追踪器、查数据库、开 PR、更新工单。在游戏开发场景中，这意味着 Agent 能直接读取 Jira 上的 Bug 列表、访问 Perforce/Git 的提交记录、触发 Jenkins 的构建流程。

工作树（Worktrees）：多个 Agent 同时工作时，各自在独立分支的独立目录上操作，互不污染，干完自动清理。这是并行不退化成混乱的前提。

第六样是记忆——落在磁盘上的状态文件，记着「干完了什么、还剩什么、上次踩了什么坑」。模型每次重启都失忆，所以记忆必须活在单次对话之外。

游戏开发中的 Loop 应用场景

理解了循环的构成，关键问题是：哪些游戏开发工作适合做成循环？判断标准有四个——任务足够重复（至少每周发生一次）、结果能自动验证、Token 预算充足、工具链已接通。

场景一：CI 构建失败自动分诊。大型 UE5 项目的 CI 流水线经常因为各种原因挂掉——材质编译错误、蓝图引用丢失、着色器编译超时。传统方式是开发者手动查看日志、定位问题、修复、重新提交。用 Loop 可以做到：每天定时检查 CI 状态，发现失败后自动拉取日志，分析错误类型，尝试常见修复模式（清理中间产物、更新依赖、回退冲突提交），修复后自动触发重新构建。搞不定的才升级给人处理。

场景二：资产规范批量检查。游戏项目中，美术资产命名不规范、LOD 配置错误、材质通道缺失是常见问题。一个外循环可以每天扫描新增资产，对照项目规范文档检查命名、尺寸、格式、LOD 配置，不符合的自动生成报告并创建 Jira 工单。验证标准清晰：命名匹配正则、尺寸在阈值内、LOD 层级完整。

场景三：Bug 修复流水线。从 Jira 拉取标记为「已确认」的 Bug，按优先级排序，为每个 Bug 开一个隔离工作区，派实现 Agent 分析代码、起草修复、跑测试，验证 Agent 独立审核，通过后自动提交 PR。你每天早上看到的不再是 Bug 列表，而是待审核的 PR 列表。

场景四：跨平台适配回归测试。UE5 项目需要同时维护 PC、主机、移动端的适配。每次引擎升级或平台 SDK 更新后，需要跑一轮跨平台回归。循环可以自动在各平台构建目标上执行测试套件，收集崩溃日志和性能数据，生成对比报告。

内循环与外循环：先跑通再自动化

Loop Engineering 有一个关键区分：内循环（Agent 在一次对话中如何工作）和外循环（谁来启动 Agent、什么时候启动）。

内循环是基础。你给 AI 一个明确的完成条件，比如「把场景中所有使用旧版材质的 StaticMesh 替换为新版 Substrate 材质，替换后场景无报错且帧率不低于 55fps」，然后让它自己跑到达标为止。这对应 Claude Code 的 /goal 命令。

外循环是进阶。在内循环跑通的前提下，加定时触发（每天早上检查新增资产）、事件触发（PR 合并后自动跑测试）、或目标触发（迁移 200 个蓝图节点到新系统）。Claude Code 的 /loop 命令和 Codex 的 automation 原生支持提供了这些能力。

一条铁律：内循环没跑通之前，别碰外循环。如果 AI 连一次性任务都做不好，让它自动反复做，就是在自动化生产垃圾。正确的顺序是：先把 Harness 搭扎实（项目规范文档写清楚、验证钩子配好、权限设对），再用内循环验证可靠性，最后加外循环实现自动化。

游戏团队的落地建议

第一步：写好你的项目规范文档。这是所有后续工作的基础。无论是 CLAUDE.md、AGENTS.md 还是其他格式，核心是让 AI 在每次启动时都能快速理解项目的技术栈、命名规范、已知限制和决策历史。UE5 项目需要覆盖：蓝图组织结构、材质层叠标准、PCG 配置规范、打包发布流程。

第二步：建立可自动验证的交付标准。不是「代码质量好」这种模糊标准，而是「Unreal Automation Tool 全部通过、无编译警告、目标平台帧率达标」这种机器可检查的条件。好的完成条件有三个特征：可验证、具体、有边界。

第三步：从最小循环开始。不要一上来就搞「每天自动修复所有 Bug」这种大循环。从一个明确的、可验证的小任务开始——比如「自动检查新增蓝图是否遵循命名规范」——验证内循环能稳定交付后，再逐步扩大范围。

第四步：接入工具链。通过 MCP 连接器让 Agent 能访问 Jira、Git、CI 系统。游戏项目的工具链通常比普通软件项目更复杂（引擎编辑器、DCC 工具、版本控制、构建系统），打通这些环节是循环可靠运行的前提。

需要警惕的陷阱

Loop Engineering 不是万能药。几个需要认真对待的问题：

代码库成熟度门槛：Boris Cherny 单月 259 个 PR 的成绩，建立在他对 Claude Code 了如指掌、代码库按「适合 AI 干活」的标准收拾过的基础上。大多数游戏团队面对的是多年积累的遗留代码，文档缺失、测试不足。真正的门槛往往不是「会不会搭循环」，而是「代码库有没有达到能跑循环的状态」。

Goodhart 定律：完成条件一旦写成「测试通过、检查干净」，循环优化的目标就悄悄从「把事做对」变成了「让指标变绿」——放松断言、给 Mock 注水、用 try/catch 吞掉异常，都是它找得到的捷径。对游戏开发来说，这意味着循环可能生成「技术上通过测试但体验上完全不对」的内容。

理解债：循环产出越快，你没亲手做过、也没仔细看过的东西就越多。当产出速度超过审阅速度，瓶颈就从「做」挪到了「看」。在游戏开发中，一个没被认真审阅的材质修改可能破坏整个场景的视觉一致性。

LLM 的同质化盲区：写代码的 Agent 和检查代码的 Agent 都是 LLM，相近的训练数据意味着相近的盲区。第二个 Agent 能逮住低级错误，但一旦第一个 Agent 的整体方向就错了，两个模型很可能一起点头放行。这不构成真正的独立验证。

写在最后

Loop Engineering 的杠杆点，从来不在工具上，而在你对游戏开发工作流的理解深度上。两个人搭出一模一样的循环，结果可能完全相反：一个拿它在自己吃透的流程上跑得更快，一个拿它绕开「吃透」这件事本身。循环只奖励已经想明白的人。

从 Prompt 到 Loop，AI 工程方法论的四次迭代本质上是一部「人逐渐退场」的历史——但退场不等于淘汰。人的核心价值从「会操作 AI」变成了「会设计 AI 系统」。而系统设计、流程拆解、规则定义、异常边界，这些恰好是资深游戏开发者的原生能力。Loop Engineering 对游戏开发者不是威胁，是一次能力变现的窗口。现在正是理解这一范式、在自家项目中小范围验证的最佳时机。