模型不是关键,Harness 才是
title 模型不是关键,Harness 才是
type summary
category tech
tags AI工程Harness EngineeringAgent
created 2026-04-13
source_file 模型不是关键,Harness 才是.md
模型不是关键,Harness 才是
核心观点
同一个模型换一套 Harness,编程基准成功率从 42% 跳到 78%。Harness Engineering 是 2026 年 AI 工程圈最热话题,核心是设计让 Agent 持续、稳定、高质量工作的控制系统。模型是引擎,Harness 是方向盘和刹车。
三层进化
| 阶段 | 时间 | 核心关注 |
|---|---|---|
| Prompt Engineering | 2022-2024 | 精心构造单次指令 |
| Context Engineering | 2025 | 为每个决策点动态构建上下文 |
| Harness Engineering | 2026年2月 | 设计完整的控制系统 |
关键概念
- Harness = 给 AI Agent 套上的操作系统:管理上下文、架构约束、反馈循环、工具链、生命周期
- Agent = model + harness
- 第五阶段(Engineer the Harness):每发现 Agent 犯错,就工程化解决让它不再犯
行业案例
- OpenAI Codex:5个月百万行代码,1500 PR,人类一行没写
- Stripe Minions:每周 1300 PR 全由 Agent 完成
- Cursor:每小时 1000 commit,一周 1000 万次工具调用
- Peter Steinberger:单月 6600 commit,5-10 并行 Agent
七个杠杆
- AGENTS.md / CLAUDE.md(控制在 60 行以内)
- 确定性约束(linter、结构化测试)
- 工具精简(Vercel 从 15 砍到 2 准确率反升)
- Sub-Agent 隔离
- 反馈循环(让 Agent 自己验证产出)
- CI 限速(Stripe 最多两轮)
- 垃圾回收(定期扫描技术债)
护栏悖论
车速越快,护栏越重要。引擎越强,越需要精心设计的约束系统。
关键引用
Agent 不难,Harness 才难。(Ryan Lopopolo)
我们现在最大的挑战,在于设计环境、反馈循环和控制系统。(OpenAI 团队)