Logo LLM Wiki
Back to Summary

模型不是关键,Harness 才是

title 模型不是关键,Harness 才是
type summary
category tech
tags AI工程Harness EngineeringAgent
created 2026-04-13
source_file 模型不是关键,Harness 才是.md

模型不是关键,Harness 才是

核心观点

同一个模型换一套 Harness,编程基准成功率从 42% 跳到 78%。Harness Engineering 是 2026 年 AI 工程圈最热话题,核心是设计让 Agent 持续、稳定、高质量工作的控制系统。模型是引擎,Harness 是方向盘和刹车。

三层进化

阶段时间核心关注
Prompt Engineering2022-2024精心构造单次指令
Context Engineering2025为每个决策点动态构建上下文
Harness Engineering2026年2月设计完整的控制系统

关键概念

  • Harness = 给 AI Agent 套上的操作系统:管理上下文、架构约束、反馈循环、工具链、生命周期
  • Agent = model + harness
  • 第五阶段(Engineer the Harness):每发现 Agent 犯错,就工程化解决让它不再犯

行业案例

  • OpenAI Codex:5个月百万行代码,1500 PR,人类一行没写
  • Stripe Minions:每周 1300 PR 全由 Agent 完成
  • Cursor:每小时 1000 commit,一周 1000 万次工具调用
  • Peter Steinberger:单月 6600 commit,5-10 并行 Agent

七个杠杆

  1. AGENTS.md / CLAUDE.md(控制在 60 行以内)
  2. 确定性约束(linter、结构化测试)
  3. 工具精简(Vercel 从 15 砍到 2 准确率反升)
  4. Sub-Agent 隔离
  5. 反馈循环(让 Agent 自己验证产出)
  6. CI 限速(Stripe 最多两轮)
  7. 垃圾回收(定期扫描技术债)

护栏悖论

车速越快,护栏越重要。引擎越强,越需要精心设计的约束系统。

关键引用

Agent 不难,Harness 才难。(Ryan Lopopolo)

我们现在最大的挑战,在于设计环境、反馈循环和控制系统。(OpenAI 团队)

关联页面