Logo LLM Wiki
Back to Concept

Agent

title Agent
type concept
category tech
tags AI工程Agent
created 2026-04-15
sources 2

Agent

定义

能够自主完成任务的 AI 系统,通过调用工具、规划步骤、管理状态、响应反馈,在真实环境中持续执行并交付结果。

Agent 核心公式

Agent = Model + Harness Engineering

类比:模型是 CPU,Harness 是操作系统。

Agent 的关键能力

  1. 工具调用:连接外部世界,执行真实任务
  2. 任务规划:理解目标→判断信息→执行→检查→修正
  3. 状态管理:跟踪进度、保持上下文连续性
  4. 自我评估:知道自己做得好不好
  5. 错误恢复:失败后能回滚到稳定状态

行业案例

  • OpenAI Codex:5个月百万行代码,人类一行没写
  • Stripe Minions:每周 1300 PR 全由 Agent 完成
  • Cursor:每小时 1000 commit
  • Anthropic Computer Use:自主操控浏览器执行任务

构建 95 分 Agent 系统的三层架构

  • Prompt Engineering:70+ 分基线,是三者的基石
  • Context Engineering:提升到 80~85 分
  • Harness Engineering:提升到 90~95 分

一个好的 Prompt 是绝对的效果保障和底气。如果没有一个 70+ 分的底子,即使再怎么设计和调优 Context、Harness,Agent 的基线已经拉低了。

来源