最近爆火的 Harness Engineering 到底是啥？一期讲透！

核心观点

AI工程经历了三次范式转移：Prompt Engineering（让模型听懂指令）→ Context Engineering（给模型正确信息）→ Harness Engineering（让模型持续做对）。Harness 的核心目标是解决"为什么同样的模型，别人做出来的 Agent 可以连续跑很久，自己就总是差强人意"的问题。

关键结论：Agent = Model + Harness，模型是 CPU，Harness 是操作系统。真正决定能不能落地、能不能稳定交付的就是 Harness，而不是模型本身。

关键概念

三层范式对比

范式	解决什么问题	类比
Prompt Engineering	怎么把任务讲清楚	告诉新人怎么说
Context Engineering	怎么把信息都给对	告诉新人准备什么资料
Harness Engineering	怎么让模型持续做对	让新人带检查清单、关键节点汇报、验收结果

Harness 六层架构

Context 层：决策目标定义、信息筛选选择、结构化组织
工具系统层：给什么工具、何时调用、结果如何过滤筛选
执行规划层：理解目标→判断信息→继续执行→检查输出→修正重试
记忆和状态层：当前任务状态、过程中的中间结果、长期记忆和用户偏好
评估和决策层：输出验证、自动测试日志和指标、自我复盘
约束与恢复层：约束边界、验证检查点、失败后回滚

一线公司实践

Anthropic：解决"上下文焦虑"（Context Compression 不够用时，用 Context Reflection 换干净 Agent 交接工作）；采用"干活的人和验收的人分开"策略
OpenAI：人类工程师只负责设计环境、拆解任务、建立反馈电路；把自身工程师经验写成系统规则（不只是报错，而是把怎么修也一起给 Agent）
朗称：底层模型完全不变，只通过改造 Harness，智能体验从三十名外杀到前五

关键引用

"AI落地的核心挑战，正在从让模型看起来更聪明，转向让模型在真实世界里稳定的工作。"

"当 Agent 出了问题的时候，修法几乎从来不是要更努力一点，而是确定它缺了什么样的结构性能力。"

来源

Harness Engineering

代码块

text

最近爆火的HarnessEngineering到底是啥？一期讲透！