最近爆火的HarnessEngineering到底是啥?一期讲透!
title 最近爆火的 Harness Engineering 到底是啥?一期讲透!
type summary
category tech
tags AI工程AgentHarness Engineering
created 2026-04-15
source_file 最近爆火的 Harness Engineering 到底是啥?一期讲透!.txt
最近爆火的 Harness Engineering 到底是啥?一期讲透!
核心观点
AI工程经历了三次范式转移:Prompt Engineering(让模型听懂指令)→ Context Engineering(给模型正确信息)→ Harness Engineering(让模型持续做对)。Harness 的核心目标是解决"为什么同样的模型,别人做出来的 Agent 可以连续跑很久,自己就总是差强人意"的问题。
关键结论:Agent = Model + Harness,模型是 CPU,Harness 是操作系统。真正决定能不能落地、能不能稳定交付的就是 Harness,而不是模型本身。
关键概念
三层范式对比
| 范式 | 解决什么问题 | 类比 |
|---|---|---|
| Prompt Engineering | 怎么把任务讲清楚 | 告诉新人怎么说 |
| Context Engineering | 怎么把信息都给对 | 告诉新人准备什么资料 |
| Harness Engineering | 怎么让模型持续做对 | 让新人带检查清单、关键节点汇报、验收结果 |
Harness 六层架构
- Context 层:决策目标定义、信息筛选选择、结构化组织
- 工具系统层:给什么工具、何时调用、结果如何过滤筛选
- 执行规划层:理解目标→判断信息→继续执行→检查输出→修正重试
- 记忆和状态层:当前任务状态、过程中的中间结果、长期记忆和用户偏好
- 评估和决策层:输出验证、自动测试日志和指标、自我复盘
- 约束与恢复层:约束边界、验证检查点、失败后回滚
一线公司实践
- Anthropic:解决"上下文焦虑"(Context Compression 不够用时,用 Context Reflection 换干净 Agent 交接工作);采用"干活的人和验收的人分开"策略
- OpenAI:人类工程师只负责设计环境、拆解任务、建立反馈电路;把自身工程师经验写成系统规则(不只是报错,而是把怎么修也一起给 Agent)
- 朗称:底层模型完全不变,只通过改造 Harness,智能体验从三十名外杀到前五
关键引用
"AI落地的核心挑战,正在从让模型看起来更聪明,转向让模型在真实世界里稳定的工作。"
"当 Agent 出了问题的时候,修法几乎从来不是要更努力一点,而是确定它缺了什么样的结构性能力。"
来源
代码块
text