Summary · AI

模型不是关键，Harness 才是

AI 2026-04-13 · 2 min read · 5 backlinks

AI工程 Harness Engineering Agent

模型不是关键，Harness 才是

核心观点

同一个模型换一套 Harness，编程基准成功率从 42% 跳到 78%。Harness Engineering 是 2026 年 AI 工程圈最热话题，核心是设计让 Agent 持续、稳定、高质量工作的控制系统。模型是引擎，Harness 是方向盘和刹车。

三层进化

阶段	时间	核心关注
Prompt Engineering	2022-2024	精心构造单次指令
Context Engineering	2025	为每个决策点动态构建上下文
Harness Engineering	2026年2月	设计完整的控制系统

关键概念

Harness = 给 AI Agent 套上的操作系统：管理上下文、架构约束、反馈循环、工具链、生命周期
Agent = model + harness
第五阶段（Engineer the Harness）：每发现 Agent 犯错，就工程化解决让它不再犯

行业案例

OpenAI Codex：5个月百万行代码，1500 PR，人类一行没写
Stripe Minions：每周 1300 PR 全由 Agent 完成
Cursor：每小时 1000 commit，一周 1000 万次工具调用
Peter Steinberger：单月 6600 commit，5-10 并行 Agent

七个杠杆

AGENTS.md / CLAUDE.md（控制在 60 行以内）
确定性约束（linter、结构化测试）
工具精简（Vercel 从 15 砍到 2 准确率反升）
Sub-Agent 隔离
反馈循环（让 Agent 自己验证产出）
CI 限速（Stripe 最多两轮）
垃圾回收（定期扫描技术债）

护栏悖论

车速越快，护栏越重要。引擎越强，越需要精心设计的约束系统。

关键引用

Agent 不难，Harness 才难。（Ryan Lopopolo）

我们现在最大的挑战，在于设计环境、反馈循环和控制系统。（OpenAI 团队）

关联页面

Backlinks 5 references

S 告别氛围编程-Harness治理与SDD团队级AI研发实践 S 最近爆火的HarnessEngineering到底是啥？一期讲透！ S 深度解析Claude Code在Prompt_Context_Harness的设计与实践 C Claude Code vs Hermes Harness C Claude Code