Concept · AI
验证闭环
AI 2026-05-08 · 2 min read · 4 backlinks
验证闭环
定义
AI Agent 完成编码后,能自主执行"改→构建→启动→验证→修复"的完整循环,不依赖人工介入确认。验证闭环是 Agent 夜间自主执行和长时间运行的前提。
验证层次
- 编译通过:最基础,但远远不够
- lint/格式检查:代码变更后自动触发
- 接口验证:启动服务后用 curl 跑接口确认数据正确
- UI验证:Agent Browser 打开浏览器/操作页面/截屏对比
- E2E验证:前后端联调全链路跑通
实现要点
- 一键启动脚本:封装环境检测/构建/启动/健康检查
- curl验证规范:每个curl独立执行、临时文件传递、Token模板化(避免shell兼容性坑)
- 可程序化门禁:
status == SUCCESS && total_tests > 0 && passed == total - 错误信息格式:WHAT(违规)+ WHY(原因)+ HOW(修复)——AI读到能直接修
核心原则
"写完代码不算完,自测过功能才算完。"
"If it can't be mechanically enforced, the agent will drift."
与其他概念的关系
- Harness Engineering — 验证闭环是 Harness 四支柱中"结构化执行"的关键环节
- Scripts(Harness Engineering) — 验证闭环依赖确定性脚本作为硬门禁
来源
Backlinks 4 references