从人机关系重新理解Agent工程范式的变化

认知的“肿块”

从早期的 Prompt Engineering，到 2025 年年中的 Context Engineering，再到 2026 年初的 Harness Engineering，现在又来到了 Loop Engineering，层出不穷的术语迭代是别有用心的人刻意贩卖的文字游戏吗？答案既是，也不是

这类概念的创造，当然由一些前沿实验室与科技企业为了抢夺行业话语权、引领技术路线而刻意创造的，也确实在一定程度上制造了行业的概念内卷和浮躁的氛围。但正如维特根斯坦的核心洞见：语言根植于人的实践生存需求。作为人们传播、沟通的对齐工具，术语的更迭必然反映技术体系内底层框架的变化，以及核心矛盾的转移

即当行业不断产生的新的理解撞上语言的界限，撞出了认知的肿块，为了缓解这种内在的张力，人们不得不重新发明一些新的语言，来量化这些新鲜的事物和新的状态

作为从业者，我们当然不必过度追逐表层名词、盲从新概念，一味跟风只会将我们陷于一些文字游戏的纠缠之中。真正值得我们深挖的，是术语背后底层逻辑的变迁，以及推动这套逻辑发生变化的内在根源

矛盾的转移

需要说明的是，下文按"行业何时将某类实践上升为系统性工程学科"来划分阶段，而非底层技术的发明时间。RAG（2020）、Function Calling（2023）、ReAct（2022）等技术的出现远早于对应术语的流行——术语标记的是认知结晶的时刻，而非技术诞生的时刻。

1. Prompt Engineering — 标准化单次沟通

大模型涌现泛化能力，但缺乏稳定的交互范式

2020 年 GPT-3 发布，标志着大语言模型从 BERT 时代"每个任务单独微调"的范式，跃迁到"单一模型通过提示即可完成多种任务"的新阶段。我们不再需要把领域知识压缩进模型参数，只需在输入文本中描述任务，模型即可通过上下文学习（In-Context Learning）来遵循指令。

然而早期模型的指令遵循能力很弱，也没有固定的人机交互协议。用户随便一段话丢给模型，输出完全不可控——逻辑断裂、格式混乱、任务理解跑偏、复杂需求直接接不住。这意味着至少有四个直接问题：

模型无固定任务范式，无法稳定对齐用户意图；
纯自由文本难以承载复杂规则、业务标准、推理逻辑；
多步骤推理缺少思考引导，一步出错则后续全部断层；
每次对话无法复用历史成功交互模式，相同场景反复重写。

**本质目的：**把"人与模型的单次沟通"标准化。通过角色设定、Few-shot 示例、CoT 推理模板、格式约束等手段，以低成本文本改造弥补原生模型指令遵循弱、推理能力不足的缺陷，让单次模型输出可控、可用——解决最基础的"模型听不懂、输出乱"的底层问题。

2. Context Engineering — 动态信息供给

前代瓶颈：Prompt 是静态模板，既装不下足够信息，也无法按需动态调整

只做提示词优化会立刻遇到天花板：

上下文窗口存在硬性 token 上限，业务背景、知识库、历史对话塞进去就溢出，模型截断关键信息；
Prompt 本质是写死的静态模板，面对不同任务、不同阶段无法自适应地筛选和组织信息；
单次 Prompt 无法存储长期事实和业务文档，每轮对话都要重复粘贴背景，跨会话完全失忆；
缺少检索、压缩、重排机制，无法动态筛选当前任务真正需要的精准片段。

**本质目的：**脱离"一次性静态 Prompt"的局限，搭建一套动态信息供给体系：分层记忆、RAG 检索、上下文压缩、token 预算调度，按需向模型推送当前任务真正需要的信息，解决信息容量、信息筛选、长期记忆三大痛点，让模型拥有稳定、轻量化的信息底座。

3. Harness Engineering — 安全执行运行时

前代瓶颈：模型只有文本生成能力，无法与真实世界交互，无约束、不可运维

当模型拥有充足上下文后，新矛盾出现——LLM 只能输出文字，没有对外操作能力，同时行为不受管控：

无法调用 API、数据库、文件系统、业务工具，只能空谈无法落地；
即使赋予工具调用能力，模型仍可能生成危险 SQL、发起越权操作，缺乏权限隔离与执行沙箱；
执行过程无日志、无埋点、无报错捕获，出问题无法排查；
工具调用失败无重试、无校验，幻觉输出直接流入业务系统造成故障；
缺少安全护栏、隐私脱敏、越界拦截机制，存在生产事故风险。

因此工程上必须补齐：打通与外部系统的执行通道、建立沙箱与权限分级、全链路可观测（日志 / 链路追踪 / 异常捕获）、输出校验与失败重试、统一工具描述与执行回滚机制。

**本质目的：**给纯文本 LLM 包裹一层生产级执行运行时，解决"只能说不能做、行为不可控、无法线上运维"的问题，把模型从纯对话文本工具，变成可以安全操作外部系统的执行单元，是 Demo 走向企业落地的必备层。

4. Loop Engineering — 自治任务闭环

前代瓶颈：模型能执行单步工具调用，但每步决策仍依赖人工驱动，缺少自主规划与纠错能力

模型有了信息（Context）和操作工具（Harness），可以在人指示下完成单步操作，但依然无法自主推进多步任务：

复杂长任务（数据分析、工单处理、全流程自动化）需要几十步操作，每步都要人手动下发指令；
模型不会自主拆解目标、不会反思上一步错误、不会根据观测结果调整下一步行动；
任务中断无状态留存，中途失败需人工从头重启；
缺少终止判断逻辑，无法自主判定任务是否完成。

要让 Agent 真正从"对话器"变成"执行者"，还必须：内置规划-行动-观测-反思的标准闭环，持久化任务状态以支持中断恢复，并统一终止与校验逻辑，使其能无人值守地完成长链路目标。

**本质目的：**构建自治任务引擎，把分步决策、流程推进、自我校验的工作交给 AI，人类只需要下发顶层目标，不用介入中间所有操作，实现从"人机一问一答"到"目标委托式自治"的跃迁，是复杂自动化 Agent 的核心骨架。

5. Meta-Loop Engineering — Agent 自我进化

前代瓶颈：整套 Prompt / Context / Harness / Loop 全靠人工维护，迭代成本极高

拥有自治 Loop Agent 后，工程运维成本成为新瓶颈：

业务场景变更时，需要人工修改提示词、调整检索策略、修改工具配置、重构循环逻辑；
不同任务需要手动调试各自独立的 Agent 配置，复用性差；
Agent 运行中持续产生失败与幻觉案例，没有自动化机制回收经验、迭代策略；
人工调参与调试需要大量工程师人力，规模化平台成本不可控。

这把问题推高到了又一层：让 Agent 基于自身运行数据与失败样本自主优化信息供给、工具调用和反思逻辑，动态适配多变业务场景，形成闭环优化的第二层外循环。

**本质目的：**把"Agent 自身的工程调优工作"也交给 Agent 自治完成，人类仅保留顶层安全约束、验收标准，不再参与日常配置迭代，解决规模化 Agent 平台长期维护成本过高的产业痛点。Meta-Loop 目前仍处于早期探索阶段，尚无公认的成熟框架，但它代表的方向——平台化、通用化 Agent 的自我进化——已经成为下一代工程体系的核心议题。

边界的消融

每一层脚手架，重画一次分工线

1. Prompt Engineering 阶段：指令交付范式 —— 人是全程引导员，AI 是单次文本生成器

人承担：完整思考逻辑、任务拆解、上下文记忆、纠错、多轮引导、格式约束、问题细化；每一轮都要人把完整需求、背景、规则全部复述一遍。
AI 承担：仅做文本续写、单次推理输出，无记忆、无工具、无自主推进能力。

人承担绝大多数认知劳动，AI 只是"文字复印机"；复杂多步骤任务高度依赖人实时手把手引导，人一旦中断，任务直接终止。这一阶段只优化「人向 AI 传递单次指令」的沟通效率，不改变人机权责分配。

2. Context / Memory Engineering 阶段：信息托管范式 —— 人负责沉淀资料，AI 负责读取上下文记忆

人承担：搭建知识库、整理历史对话、划分信息优先级、维护长期事实；依然需要人主动推进步骤、修正错误、发起下一步动作。
AI 承担：自动留存会话历史、按需检索外部资料、自动裁剪冗余上下文，不用人重复复述背景信息。

人类从"反复重复背景"的重复劳动中解放，但决策、行动、流程推进依然完全属于人；AI 只是随身知识库。本质上是把「信息存储、信息筛选」的工作交给 AI，认知决策仍由人垄断。

3. Harness Engineering 阶段：环境授权范式 —— 人制定规则与工具权限，AI 获得行动能力

人承担：定义可用工具、权限边界、安全护栏、失败兜底策略、数据读写权限、状态快照规则；人划定"AI 可以触碰什么、绝对不能做什么"。
AI 承担：自主调用工具、读写外部系统、执行增删改查、自动校验输出、遇到轻度错误自动重试；第一次拥有对外界环境操作的能力。

AI 不再只能输出文字，具备动手执行的权力；人类不再包办所有操作，转为规则制定者、权限审批者。这一阶段完成「认知思考」和「物理执行」的人机拆分：AI 思考 + 操作，人管控风险与边界。

4. Loop Engineering 阶段：目标委托范式 —— 人只给最终目标，AI 自主走完完整任务链路

人承担：输入顶层业务目标、设定终止条件、定义评价标准；不需要介入中间任何细分步骤，不用分步引导、不用手动触发工具。
AI 承担：任务拆解、分步规划、工具调用、结果观测、自我反思纠错、循环迭代直到目标达成；完整自治闭环。

人机从"一问一答的交互关系"变成委托代理关系：人是委托人，AI 是全权代理人。人只关心结果，过程完全交给 AI 自主处理。这一阶段把「流程推进、分步决策、自我校验」这部分连续认知劳动转移给 AI，是从"对话工具"到"自主智能体"的分水岭。

5. Multi-Agent Orchestration 阶段：团队委托范式 —— 人搭建智能体团队组织架构，AI 内部自主分工协作

人承担：划分角色、分配职能、设定协作规则、制定冲突协调机制；只搭建团队框架，不介入 Agent 内部沟通与分工。
AI 承担：多角色自主沟通、任务分发、并行执行、交叉校验、互相辩论修正，群体协同完成复杂大型任务。

人类从"和单个 AI 协作"升级为"管理一套 AI 团队"，人机协作变成人管理 AI 组织。

6. Meta-Loop / Meta-Harness 元工程阶段：范式自迭代 —— 人只定义顶层评价约束，AI 自主优化人机分工本身

人承担：固定不变的底线约束（安全红线、资源上限、业务验收标准），不再手动维护 Prompt、记忆策略、工具链、循环逻辑。
AI 承担：自动调优提示词、重构检索策略、调整工具调用逻辑、优化循环反思机制、迭代自身 Harness 脚手架；AI 自主优化"人和 AI 该怎么分工"这套体系。

人类退出日常运维、调参、流程配置工作，仅保留顶层价值与安全管控；AI 持续自适应调整自身能力边界，动态重新分配人机工作量。

三条不归路

趋势 1：人类劳动持续上移，从"执行层"不断走向"决策 / 约束层"

劳动层级下沉到 AI：文本生成 → 信息检索记忆 → 工具操作 → 全流程自主闭环 → 多智能体协同 → 自我系统优化

人类角色同步升级：对话操作员 → 信息管理员 → 规则权限架构师 → 目标委托人 → 顶层约束制定者

趋势 2：人机交互频次持续下降，交互颗粒度持续变粗

Prompt 时代：逐轮细粒度交互，人每一步都要说话；
Loop 时代：粗粒度交互，一次目标交付，数小时无人工干预；
Meta 工程时代：极少交互，一次设定约束，Agent 持续自主运行优化。

产业落地直观体现：客服、运维、数据分析、研发自动化场景，人工介入频次大幅降低。

趋势 3：分工边界从静态固定，走向动态自适应

前四层工程的人机边界是人静态写死的（固定 Prompt、固定工具列表、固定循环逻辑）；

元工程阶段，AI 可以根据任务难度、数据变化、失败案例动态调整分工：简单任务 AI 全包，高风险步骤自动转交人工复核，实现弹性人机分工。

循环即终局

任何一个快速发展的领域，都会先涌现出大量旧理论无力描述的新现象。实践跑到前面去了，理论和解释则滞后。当解释终于到来，它会回头夯实我们一段时间的探索——形成共识，校准方向，然后才能支撑我们继续向上走。

今天的 Agent 领域就在这个阶段。每天早上醒来，你都会看到全然不同于昨日的新方法、新定义、新理论需要学习、需要跟进，还得不断地去伪存真，在脑子里拼出一个自洽合理的知识体系。

Loop Engineering 就是在这波浪潮中浮现出来的新名词之一。当你去看相关的讨论、框架设计、社区文章，会看到它试图描述这样一种模式：给 Agent 一个目标，让它在一个"思考 → 行动 → 观察 → 再思考"的循环中自主运转，直到任务完成。

但看着看着，我脑子里总冒出同一个念头：我是不是在哪见过这个？

命名：什么是 Loop

在一个概念引发"似曾相识"的感受之后，我们需要先给它一个清晰的定义。Loop 在这个语境下指的是：

Loop 是我们从外部观察事物运行时，看到的一种模式——系统在反复执行一个"输入 → 处理 → 输出 → 反馈 → 再输入"的周期，直到某种条件满足而终止。它不是系统内部的"感受"，而是外部观察者投射上去的一种抽象描述。

这里有三个关键点：

Loop 是外部视角的产物。 CPU 不知道自己在取指-译码-执行，Transformer 不知道自己在自回归，Agent 不知道自己在 ReAct。它们只是在依照自身的规律运转。而观察者——无论是人还是另一个系统——为了理解、预测和控制这些行为，在外部为它们构建了一个统一的心智模型：这是一个循环。
不同层次的观察者看到不同粒度的 Loop。 同一个系统，对硬件工程师来说是一次指令循环，对操作系统来说是进程调度循环，对前端开发者来说是事件循环。系统本身没有变，变的是观察者站的抽象层级。
“一次循环"的边界是观察者划定的。 系统确实在循环运转——这是一个本体论事实。但什么是"一次”——是从取指到写回算一次推理，还是从输入到输出算一次推理——这个边界取决于你站在哪里看。

它无处不在：Loop 模式在三个领域中的普遍性

控制论中的 Loop

控制论（Cybernetics）在 1940 年代就把这件事说透了。维纳的核心洞见是：一切有目的的行为都可以归结为"负反馈控制回路"——系统感知当前状态与目标状态的偏差，采取行动缩小偏差，再重新感知，周而复始。

恒温器是最简单的例子：测温 → 比较设定值 → 开/关加热器 → 环境温度变化 → 再测温。但这个结构的覆盖面远不止家电——导弹制导、飞行器自动驾驶、工业 PID 控制、生物体的体温调节和血糖调节，全部是同构的：感知 → 比较 → 决策 → 执行 → 环境变化 → 再感知。

控制论告诉我们几个重要的事：

闭环（closed-loop）和开环（open-loop）的分水岭是"反馈"。没有反馈的系统只是在盲目执行预编程指令，无法纠错、无法适应环境变化。
系统的稳定性、响应速度、超调量、收敛性——这些性质全部取决于反馈回路的设计参数（增益、延迟、阻尼比）。
复杂系统往往是多层嵌套的控制回路：内环快速响应、外环设定目标，形成层级化的 Loop 架构。

日常系统中的 Loop

跳出控制论的理论框架，你会发现 Loop 结构以各种变体渗透在我们每天接触的系统中：

计算机体系结构。 CPU 的取指-译码-执行-写回（Fetch-Decode-Execute-Writeback）是硬件级的 Loop；操作系统的进程调度是 OS 级的 Loop；事件驱动编程中的 Event Loop 是应用级的 Loop。你写的每一行代码最终都运行在层层嵌套的 Loop 之上。

软件工程方法论。 瀑布模型的失败催生了迭代开发：需求 → 设计 → 实现 → 测试 → 反馈 → 修正需求。敏捷的 Sprint、精益的 Build-Measure-Learn、DevOps 的 CI/CD Pipeline——本质上都是在人为制造更短、更快的反馈循环，因为更短的 Loop 意味着更快的纠错和更低的失败代价。

科学方法本身。 观察 → 假设 → 实验 → 验证/否证 → 修正假设。波普尔的证伪主义、库恩的范式革命——对科学进步的一切描述，剥掉术语都是一个认知反馈循环。

生物进化。 变异 → 选择 → 适应 → 再变异。达尔文的自然选择就是一个以世代为刻度的超长周期 Loop，只不过没有显式的"控制器"，选择压力充当了隐式的反馈信号。

AI Agent 中的 Loop

回到 Agent 领域，Loop 的显现更加直白：

Transformer 的自回归推理。 每一次 forward pass 生成一个 token，这个 token 被拼回上下文成为下一次推理的输入。这是 token 粒度的 Loop——模型自身的输出即是输入的一部分。

ReAct 模式。 Thought → Action → Observation → Thought。模型先推理应该做什么，调用工具，观察结果，再决定下一步。这是 Agent 决策粒度的 Loop。

多步任务执行。 拆解任务 → 执行子任务 → 检查结果 → 如果未达标则修正计划 → 执行下一步。这是任务粒度的 Loop。

多 Agent 协作。 Agent A 产出 → Agent B 评审反馈 → Agent A 修正 → 再提交。这是组织粒度的 Loop。

自我优化。 运行 → 收集失败样本 → 调整 Prompt/策略 → 再运行。这是元层级的 Loop。

从 token 到任务到组织到元优化，Agent 系统中叠了至少四五层不同粒度的 Loop，它们嵌套运行，和控制论中内环/外环的多层架构如出一辙。

Loop 的本质：外部性的抽象观察

把三个领域的 Loop 放在一起，不是为了说"它们长得像"，而是为了追问一个更根本的问题：为什么到处都是 Loop？

答案不在系统那边，在观察者这边。

Loop 是人类（或任何认知主体）在面对复杂动态系统时，最自然、最低认知成本的建模方式。我们无法一次理解一个系统从头到尾的全部状态演化轨迹，于是我们在时间维度上做了一个压缩：找到一个"重复单元"，把无穷长的过程折叠为"一次循环的描述 + 终止条件"。这不是系统的属性，而是我们理解系统的方式。

从这个视角回看本文前半部分的五层工程范式：

Loop 的"新"不在结构，在对象。 控制论的 Loop 控制的是物理系统（温度、速度、位置）；软件工程的 Loop 控制的是代码质量和交付节奏；AI Agent 的 Loop 控制的是认知任务的推进。结构从未变过——感知、决策、行动、反馈——变的只是被控对象从物理世界走向了认知世界。
Loop Engineering 的真正贡献不是发现了 Loop，而是把 Loop 意识显式化了。 过去做 Agent 的人也在写循环，但往往是隐式的、ad-hoc 的。Loop Engineering 做的事是：把这个循环当作一等公民来设计——它有明确的状态机、有终止条件、有中断恢复、有可观测性、有嵌套层级。这不是发明了一个新范式，而是把一个古老的范式在新领域里做了工程化加固。
所有"新"的工程学科，都是在重新发现 Loop 的变体。 Context Engineering 是信息供给的循环优化；Harness Engineering 是执行安全性的循环保障；Loop Engineering 是任务推进的循环自治；Meta-Loop 是循环本身的循环优化。术语在分化，底层的拓扑结构始终是一个——闭环反馈。

认知的“肿块”#

矛盾的转移#

1. Prompt Engineering — 标准化单次沟通#

2. Context Engineering — 动态信息供给#

3. Harness Engineering — 安全执行运行时#

4. Loop Engineering — 自治任务闭环#

5. Meta-Loop Engineering — Agent 自我进化#

边界的消融#

每一层脚手架，重画一次分工线#

1. Prompt Engineering 阶段：指令交付范式 —— 人是全程引导员，AI 是单次文本生成器#

2. Context / Memory Engineering 阶段：信息托管范式 —— 人负责沉淀资料，AI 负责读取上下文记忆#

3. Harness Engineering 阶段：环境授权范式 —— 人制定规则与工具权限，AI 获得行动能力#

4. Loop Engineering 阶段：目标委托范式 —— 人只给最终目标，AI 自主走完完整任务链路#

5. Multi-Agent Orchestration 阶段：团队委托范式 —— 人搭建智能体团队组织架构，AI 内部自主分工协作#

6. Meta-Loop / Meta-Harness 元工程阶段：范式自迭代 —— 人只定义顶层评价约束，AI 自主优化人机分工本身#

三条不归路#

趋势 1：人类劳动持续上移，从"执行层"不断走向"决策 / 约束层"#

趋势 2：人机交互频次持续下降，交互颗粒度持续变粗#

趋势 3：分工边界从静态固定，走向动态自适应#

循环即终局#

命名：什么是 Loop#

它无处不在：Loop 模式在三个领域中的普遍性#

控制论中的 Loop#

日常系统中的 Loop#

AI Agent 中的 Loop#

Loop 的本质：外部性的抽象观察#