Concept · AI

验证闭环

AI 2026-05-08 · 2 min read · 4 backlinks

AI-Coding 质量保障自动化测试

验证闭环

定义

AI Agent 完成编码后，能自主执行"改→构建→启动→验证→修复"的完整循环，不依赖人工介入确认。验证闭环是 Agent 夜间自主执行和长时间运行的前提。

验证层次

编译通过：最基础，但远远不够
lint/格式检查：代码变更后自动触发
接口验证：启动服务后用 curl 跑接口确认数据正确
UI验证：Agent Browser 打开浏览器/操作页面/截屏对比
E2E验证：前后端联调全链路跑通

实现要点

一键启动脚本：封装环境检测/构建/启动/健康检查
curl验证规范：每个curl独立执行、临时文件传递、Token模板化（避免shell兼容性坑）
可程序化门禁：status == SUCCESS && total_tests > 0 && passed == total
错误信息格式：WHAT（违规）+ WHY（原因）+ HOW（修复）——AI读到能直接修

核心原则

"写完代码不算完，自测过功能才算完。"

"If it can't be mechanically enforced, the agent will drift."

与其他概念的关系

Harness Engineering — 验证闭环是 Harness 四支柱中"结构化执行"的关键环节
Scripts（Harness Engineering） — 验证闭环依赖确定性脚本作为硬门禁

来源

Backlinks 4 references

S Harness Engineering实践-AI自动评测优化平台 S 一个文件让AI Coding效率翻倍-AGENTS实践指南.md C Rubrics评测 C 自动化评测