认知的“肿块”
从早期的 Prompt Engineering,到 2025 年年中的 Context Engineering,再到 2026 年初的 Harness Engineering,现在又来到了 Loop Engineering,层出不穷的术语迭代是别有用心的人刻意贩卖的文字游戏吗?答案既是,也不是
这类概念的创造,当然由一些前沿实验室与科技企业为了抢夺行业话语权、引领技术路线而刻意创造的,也确实在一定程度上制造了行业的概念内卷和浮躁的氛围。但正如维特根斯坦的核心洞见:语言根植于人的实践生存需求。作为人们传播、沟通的对齐工具,术语的更迭必然反映技术体系内底层框架的变化,以及核心矛盾的转移
即当行业不断产生的新的理解撞上语言的界限,撞出了认知的肿块,为了缓解这种内在的张力,人们不得不重新发明一些新的语言,来量化这些新鲜的事物和新的状态
作为从业者,我们当然不必过度追逐表层名词、盲从新概念,一味跟风只会将我们陷于一些文字游戏的纠缠之中。真正值得我们深挖的,是术语背后底层逻辑的变迁,以及推动这套逻辑发生变化的内在根源
矛盾的转移
需要说明的是,下文按"行业何时将某类实践上升为系统性工程学科"来划分阶段,而非底层技术的发明时间。RAG(2020)、Function Calling(2023)、ReAct(2022)等技术的出现远早于对应术语的流行——术语标记的是认知结晶的时刻,而非技术诞生的时刻。
1. Prompt Engineering — 标准化单次沟通
大模型涌现泛化能力,但缺乏稳定的交互范式
2020 年 GPT-3 发布,标志着大语言模型从 BERT 时代"每个任务单独微调"的范式,跃迁到"单一模型通过提示即可完成多种任务"的新阶段。我们不再需要把领域知识压缩进模型参数,只需在输入文本中描述任务,模型即可通过上下文学习(In-Context Learning)来遵循指令。
然而早期模型的指令遵循能力很弱,也没有固定的人机交互协议。用户随便一段话丢给模型,输出完全不可控——逻辑断裂、格式混乱、任务理解跑偏、复杂需求直接接不住。这意味着至少有四个直接问题:
- 模型无固定任务范式,无法稳定对齐用户意图;
- 纯自由文本难以承载复杂规则、业务标准、推理逻辑;
- 多步骤推理缺少思考引导,一步出错则后续全部断层;
- 每次对话无法复用历史成功交互模式,相同场景反复重写。
**本质目的:**把"人与模型的单次沟通"标准化。通过角色设定、Few-shot 示例、CoT 推理模板、格式约束等手段,以低成本文本改造弥补原生模型指令遵循弱、推理能力不足的缺陷,让单次模型输出可控、可用——解决最基础的"模型听不懂、输出乱"的底层问题。
2. Context Engineering — 动态信息供给
前代瓶颈:Prompt 是静态模板,既装不下足够信息,也无法按需动态调整
只做提示词优化会立刻遇到天花板:
- 上下文窗口存在硬性 token 上限,业务背景、知识库、历史对话塞进去就溢出,模型截断关键信息;
- Prompt 本质是写死的静态模板,面对不同任务、不同阶段无法自适应地筛选和组织信息;
- 单次 Prompt 无法存储长期事实和业务文档,每轮对话都要重复粘贴背景,跨会话完全失忆;
- 缺少检索、压缩、重排机制,无法动态筛选当前任务真正需要的精准片段。
**本质目的:**脱离"一次性静态 Prompt"的局限,搭建一套动态信息供给体系:分层记忆、RAG 检索、上下文压缩、token 预算调度,按需向模型推送当前任务真正需要的信息,解决信息容量、信息筛选、长期记忆三大痛点,让模型拥有稳定、轻量化的信息底座。
3. Harness Engineering — 安全执行运行时
前代瓶颈:模型只有文本生成能力,无法与真实世界交互,无约束、不可运维
当模型拥有充足上下文后,新矛盾出现——LLM 只能输出文字,没有对外操作能力,同时行为不受管控:
- 无法调用 API、数据库、文件系统、业务工具,只能空谈无法落地;
- 即使赋予工具调用能力,模型仍可能生成危险 SQL、发起越权操作,缺乏权限隔离与执行沙箱;
- 执行过程无日志、无埋点、无报错捕获,出问题无法排查;
- 工具调用失败无重试、无校验,幻觉输出直接流入业务系统造成故障;
- 缺少安全护栏、隐私脱敏、越界拦截机制,存在生产事故风险。
因此工程上必须补齐:打通与外部系统的执行通道、建立沙箱与权限分级、全链路可观测(日志 / 链路追踪 / 异常捕获)、输出校验与失败重试、统一工具描述与执行回滚机制。
**本质目的:**给纯文本 LLM 包裹一层生产级执行运行时,解决"只能说不能做、行为不可控、无法线上运维"的问题,把模型从纯对话文本工具,变成可以安全操作外部系统的执行单元,是 Demo 走向企业落地的必备层。
4. Loop Engineering — 自治任务闭环
前代瓶颈:模型能执行单步工具调用,但每步决策仍依赖人工驱动,缺少自主规划与纠错能力
模型有了信息(Context)和操作工具(Harness),可以在人指示下完成单步操作,但依然无法自主推进多步任务:
- 复杂长任务(数据分析、工单处理、全流程自动化)需要几十步操作,每步都要人手动下发指令;
- 模型不会自主拆解目标、不会反思上一步错误、不会根据观测结果调整下一步行动;
- 任务中断无状态留存,中途失败需人工从头重启;
- 缺少终止判断逻辑,无法自主判定任务是否完成。
要让 Agent 真正从"对话器"变成"执行者",还必须:内置规划-行动-观测-反思的标准闭环,持久化任务状态以支持中断恢复,并统一终止与校验逻辑,使其能无人值守地完成长链路目标。
**本质目的:**构建自治任务引擎,把分步决策、流程推进、自我校验的工作交给 AI,人类只需要下发顶层目标,不用介入中间所有操作,实现从"人机一问一答"到"目标委托式自治"的跃迁,是复杂自动化 Agent 的核心骨架。
5. Meta-Loop Engineering — Agent 自我进化
前代瓶颈:整套 Prompt / Context / Harness / Loop 全靠人工维护,迭代成本极高
拥有自治 Loop Agent 后,工程运维成本成为新瓶颈:
- 业务场景变更时,需要人工修改提示词、调整检索策略、修改工具配置、重构循环逻辑;
- 不同任务需要手动调试各自独立的 Agent 配置,复用性差;
- Agent 运行中持续产生失败与幻觉案例,没有自动化机制回收经验、迭代策略;
- 人工调参与调试需要大量工程师人力,规模化平台成本不可控。
这把问题推高到了又一层:让 Agent 基于自身运行数据与失败样本自主优化信息供给、工具调用和反思逻辑,动态适配多变业务场景,形成闭环优化的第二层外循环。
**本质目的:**把"Agent 自身的工程调优工作"也交给 Agent 自治完成,人类仅保留顶层安全约束、验收标准,不再参与日常配置迭代,解决规模化 Agent 平台长期维护成本过高的产业痛点。Meta-Loop 目前仍处于早期探索阶段,尚无公认的成熟框架,但它代表的方向——平台化、通用化 Agent 的自我进化——已经成为下一代工程体系的核心议题。
边界的消融
每一层脚手架,重画一次分工线
1. Prompt Engineering 阶段:指令交付范式 —— 人是全程引导员,AI 是单次文本生成器
- 人承担:完整思考逻辑、任务拆解、上下文记忆、纠错、多轮引导、格式约束、问题细化;每一轮都要人把完整需求、背景、规则全部复述一遍。
- AI 承担:仅做文本续写、单次推理输出,无记忆、无工具、无自主推进能力。
人承担绝大多数认知劳动,AI 只是"文字复印机";复杂多步骤任务高度依赖人实时手把手引导,人一旦中断,任务直接终止。这一阶段只优化「人向 AI 传递单次指令」的沟通效率,不改变人机权责分配。
2. Context / Memory Engineering 阶段:信息托管范式 —— 人负责沉淀资料,AI 负责读取上下文记忆
- 人承担:搭建知识库、整理历史对话、划分信息优先级、维护长期事实;依然需要人主动推进步骤、修正错误、发起下一步动作。
- AI 承担:自动留存会话历史、按需检索外部资料、自动裁剪冗余上下文,不用人重复复述背景信息。
人类从"反复重复背景"的重复劳动中解放,但决策、行动、流程推进依然完全属于人;AI 只是随身知识库。本质上是把「信息存储、信息筛选」的工作交给 AI,认知决策仍由人垄断。
3. Harness Engineering 阶段:环境授权范式 —— 人制定规则与工具权限,AI 获得行动能力
- 人承担:定义可用工具、权限边界、安全护栏、失败兜底策略、数据读写权限、状态快照规则;人划定"AI 可以触碰什么、绝对不能做什么"。
- AI 承担:自主调用工具、读写外部系统、执行增删改查、自动校验输出、遇到轻度错误自动重试;第一次拥有对外界环境操作的能力。
AI 不再只能输出文字,具备动手执行的权力;人类不再包办所有操作,转为规则制定者、权限审批者。这一阶段完成「认知思考」和「物理执行」的人机拆分:AI 思考 + 操作,人管控风险与边界。
4. Loop Engineering 阶段:目标委托范式 —— 人只给最终目标,AI 自主走完完整任务链路
- 人承担:输入顶层业务目标、设定终止条件、定义评价标准;不需要介入中间任何细分步骤,不用分步引导、不用手动触发工具。
- AI 承担:任务拆解、分步规划、工具调用、结果观测、自我反思纠错、循环迭代直到目标达成;完整自治闭环。
人机从"一问一答的交互关系"变成委托代理关系:人是委托人,AI 是全权代理人。人只关心结果,过程完全交给 AI 自主处理。这一阶段把「流程推进、分步决策、自我校验」这部分连续认知劳动转移给 AI,是从"对话工具"到"自主智能体"的分水岭。
5. Multi-Agent Orchestration 阶段:团队委托范式 —— 人搭建智能体团队组织架构,AI 内部自主分工协作
- 人承担:划分角色、分配职能、设定协作规则、制定冲突协调机制;只搭建团队框架,不介入 Agent 内部沟通与分工。
- AI 承担:多角色自主沟通、任务分发、并行执行、交叉校验、互相辩论修正,群体协同完成复杂大型任务。
人类从"和单个 AI 协作"升级为"管理一套 AI 团队",人机协作变成人管理 AI 组织。
6. Meta-Loop / Meta-Harness 元工程阶段:范式自迭代 —— 人只定义顶层评价约束,AI 自主优化人机分工本身
- 人承担:固定不变的底线约束(安全红线、资源上限、业务验收标准),不再手动维护 Prompt、记忆策略、工具链、循环逻辑。
- AI 承担:自动调优提示词、重构检索策略、调整工具调用逻辑、优化循环反思机制、迭代自身 Harness 脚手架;AI 自主优化"人和 AI 该怎么分工"这套体系。
人类退出日常运维、调参、流程配置工作,仅保留顶层价值与安全管控;AI 持续自适应调整自身能力边界,动态重新分配人机工作量。
三条不归路
趋势 1:人类劳动持续上移,从"执行层"不断走向"决策 / 约束层"
劳动层级下沉到 AI:文本生成 → 信息检索记忆 → 工具操作 → 全流程自主闭环 → 多智能体协同 → 自我系统优化
人类角色同步升级:对话操作员 → 信息管理员 → 规则权限架构师 → 目标委托人 → 顶层约束制定者
趋势 2:人机交互频次持续下降,交互颗粒度持续变粗
- Prompt 时代:逐轮细粒度交互,人每一步都要说话;
- Loop 时代:粗粒度交互,一次目标交付,数小时无人工干预;
- Meta 工程时代:极少交互,一次设定约束,Agent 持续自主运行优化。
产业落地直观体现:客服、运维、数据分析、研发自动化场景,人工介入频次大幅降低。
趋势 3:分工边界从静态固定,走向动态自适应
前四层工程的人机边界是人静态写死的(固定 Prompt、固定工具列表、固定循环逻辑);
元工程阶段,AI 可以根据任务难度、数据变化、失败案例动态调整分工:简单任务 AI 全包,高风险步骤自动转交人工复核,实现弹性人机分工。
循环即终局
任何一个快速发展的领域,都会先涌现出大量旧理论无力描述的新现象。实践跑到前面去了,理论和解释则滞后。当解释终于到来,它会回头夯实我们一段时间的探索——形成共识,校准方向,然后才能支撑我们继续向上走。
今天的 Agent 领域就在这个阶段。每天早上醒来,你都会看到全然不同于昨日的新方法、新定义、新理论需要学习、需要跟进,还得不断地去伪存真,在脑子里拼出一个自洽合理的知识体系。
Loop Engineering 就是在这波浪潮中浮现出来的新名词之一。当你去看相关的讨论、框架设计、社区文章,会看到它试图描述这样一种模式:给 Agent 一个目标,让它在一个"思考 → 行动 → 观察 → 再思考"的循环中自主运转,直到任务完成。
但看着看着,我脑子里总冒出同一个念头:我是不是在哪见过这个?
命名:什么是 Loop
在一个概念引发"似曾相识"的感受之后,我们需要先给它一个清晰的定义。Loop 在这个语境下指的是:
Loop 是我们从外部观察事物运行时,看到的一种模式——系统在反复执行一个"输入 → 处理 → 输出 → 反馈 → 再输入"的周期,直到某种条件满足而终止。它不是系统内部的"感受",而是外部观察者投射上去的一种抽象描述。
这里有三个关键点:
- Loop 是外部视角的产物。 CPU 不知道自己在取指-译码-执行,Transformer 不知道自己在自回归,Agent 不知道自己在 ReAct。它们只是在依照自身的规律运转。而观察者——无论是人还是另一个系统——为了理解、预测和控制这些行为,在外部为它们构建了一个统一的心智模型:这是一个循环。
- 不同层次的观察者看到不同粒度的 Loop。 同一个系统,对硬件工程师来说是一次指令循环,对操作系统来说是进程调度循环,对前端开发者来说是事件循环。系统本身没有变,变的是观察者站的抽象层级。
- “一次循环"的边界是观察者划定的。 系统确实在循环运转——这是一个本体论事实。但什么是"一次”——是从取指到写回算一次推理,还是从输入到输出算一次推理——这个边界取决于你站在哪里看。
它无处不在:Loop 模式在三个领域中的普遍性
控制论中的 Loop
控制论(Cybernetics)在 1940 年代就把这件事说透了。维纳的核心洞见是:一切有目的的行为都可以归结为"负反馈控制回路"——系统感知当前状态与目标状态的偏差,采取行动缩小偏差,再重新感知,周而复始。
恒温器是最简单的例子:测温 → 比较设定值 → 开/关加热器 → 环境温度变化 → 再测温。但这个结构的覆盖面远不止家电——导弹制导、飞行器自动驾驶、工业 PID 控制、生物体的体温调节和血糖调节,全部是同构的:感知 → 比较 → 决策 → 执行 → 环境变化 → 再感知。
控制论告诉我们几个重要的事:
- 闭环(closed-loop)和开环(open-loop)的分水岭是"反馈"。没有反馈的系统只是在盲目执行预编程指令,无法纠错、无法适应环境变化。
- 系统的稳定性、响应速度、超调量、收敛性——这些性质全部取决于反馈回路的设计参数(增益、延迟、阻尼比)。
- 复杂系统往往是多层嵌套的控制回路:内环快速响应、外环设定目标,形成层级化的 Loop 架构。
日常系统中的 Loop
跳出控制论的理论框架,你会发现 Loop 结构以各种变体渗透在我们每天接触的系统中:
计算机体系结构。 CPU 的取指-译码-执行-写回(Fetch-Decode-Execute-Writeback)是硬件级的 Loop;操作系统的进程调度是 OS 级的 Loop;事件驱动编程中的 Event Loop 是应用级的 Loop。你写的每一行代码最终都运行在层层嵌套的 Loop 之上。
软件工程方法论。 瀑布模型的失败催生了迭代开发:需求 → 设计 → 实现 → 测试 → 反馈 → 修正需求。敏捷的 Sprint、精益的 Build-Measure-Learn、DevOps 的 CI/CD Pipeline——本质上都是在人为制造更短、更快的反馈循环,因为更短的 Loop 意味着更快的纠错和更低的失败代价。
科学方法本身。 观察 → 假设 → 实验 → 验证/否证 → 修正假设。波普尔的证伪主义、库恩的范式革命——对科学进步的一切描述,剥掉术语都是一个认知反馈循环。
生物进化。 变异 → 选择 → 适应 → 再变异。达尔文的自然选择就是一个以世代为刻度的超长周期 Loop,只不过没有显式的"控制器",选择压力充当了隐式的反馈信号。
AI Agent 中的 Loop
回到 Agent 领域,Loop 的显现更加直白:
Transformer 的自回归推理。 每一次 forward pass 生成一个 token,这个 token 被拼回上下文成为下一次推理的输入。这是 token 粒度的 Loop——模型自身的输出即是输入的一部分。
ReAct 模式。 Thought → Action → Observation → Thought。模型先推理应该做什么,调用工具,观察结果,再决定下一步。这是 Agent 决策粒度的 Loop。
多步任务执行。 拆解任务 → 执行子任务 → 检查结果 → 如果未达标则修正计划 → 执行下一步。这是任务粒度的 Loop。
多 Agent 协作。 Agent A 产出 → Agent B 评审反馈 → Agent A 修正 → 再提交。这是组织粒度的 Loop。
自我优化。 运行 → 收集失败样本 → 调整 Prompt/策略 → 再运行。这是元层级的 Loop。
从 token 到任务到组织到元优化,Agent 系统中叠了至少四五层不同粒度的 Loop,它们嵌套运行,和控制论中内环/外环的多层架构如出一辙。
Loop 的本质:外部性的抽象观察
把三个领域的 Loop 放在一起,不是为了说"它们长得像",而是为了追问一个更根本的问题:为什么到处都是 Loop?
答案不在系统那边,在观察者这边。
Loop 是人类(或任何认知主体)在面对复杂动态系统时,最自然、最低认知成本的建模方式。我们无法一次理解一个系统从头到尾的全部状态演化轨迹,于是我们在时间维度上做了一个压缩:找到一个"重复单元",把无穷长的过程折叠为"一次循环的描述 + 终止条件"。这不是系统的属性,而是我们理解系统的方式。
从这个视角回看本文前半部分的五层工程范式:
- Loop 的"新"不在结构,在对象。 控制论的 Loop 控制的是物理系统(温度、速度、位置);软件工程的 Loop 控制的是代码质量和交付节奏;AI Agent 的 Loop 控制的是认知任务的推进。结构从未变过——感知、决策、行动、反馈——变的只是被控对象从物理世界走向了认知世界。
- Loop Engineering 的真正贡献不是发现了 Loop,而是把 Loop 意识显式化了。 过去做 Agent 的人也在写循环,但往往是隐式的、ad-hoc 的。Loop Engineering 做的事是:把这个循环当作一等公民来设计——它有明确的状态机、有终止条件、有中断恢复、有可观测性、有嵌套层级。这不是发明了一个新范式,而是把一个古老的范式在新领域里做了工程化加固。
- 所有"新"的工程学科,都是在重新发现 Loop 的变体。 Context Engineering 是信息供给的循环优化;Harness Engineering 是执行安全性的循环保障;Loop Engineering 是任务推进的循环自治;Meta-Loop 是循环本身的循环优化。术语在分化,底层的拓扑结构始终是一个——闭环反馈。