算法 | AI与机器学习1|大模型应用01.Agent原理03_Agent架构

AI架构, Agent, Harness

2026-04-25

...

整站

Harness与Agent核心概念全景图

💡 关键认知总结

Agent 的核心价值：自主性（不需要人类一步步指导，能自己规划执行）、适应性（能根据反馈调整策略，自我修正）、
工具使用（能调用外部工具完成实际任务）

Harness 的核心价值：安全性：防止 Agent 造成破坏（删文件、泄露数据、无限循环）；
可靠性：确保任务能稳定完成，支持失败恢复；可观测性：让黑盒操作变得透明，便于调试和优化

为什么 Harness 现在更重要？

企业落地第一道坎：没有 Harness，Agent 就是”不可控的野兽”
合规要求：金融、医疗等行业必须审计每一步操作
规模化前提：只有Harness 成熟，才能放心部署多个 Agent

以下是一个通用的 AI Agent 应用的完整技术栈。可以赋能给“右侧”的实际业务场景，例如研发场景、具体业务场景等。
都是围绕这四层做工，以提高AI Agent的自主能力。

一、🤖 Agent（智能体）：自主工作者

1.1 🔑 核心定义

Agent = LLM + 规划能力 + 记忆 + 工具调用 + 自我反思
它是一个有目标、能自主决策、会采取行动的智能实体。

1.2 📦 四大核心模块

模块	职责	具体例子
🧭 Planning（规划）	任务拆解、策略制定、推理路径	“要开发一个待办 App” → 拆解为：创建 HTML → 写 CSS → 写 JS → 测试 → 部署
Memory（记忆）	短期上下文、长期记忆、RAG 检索	记住项目结构、用户偏好、历史错误经验、文档知识库
🛠️ Tool Use（工具调用）	函数调用、API 集成、执行动作	调用 `write_file()`、`run_command()`、`search_web()`、`call_api()`
🔄 Reflection（反思）	自我纠错、结果评估、反馈循环	“测试失败了 → 查看错误日志 → 分析原因 → 修改代码 → 重新测试”

1.3 Agent 完整工作流示例：代码编写助手

用户输入："帮我创建一个 React 待办事项应用"

1️ Planning（规划）
   → 拆解任务：创建项目结构 → 编写组件 → 添加样式 → 实现功能 → 测试

2️⃣ Memory（记忆）
   → 检索：React 最佳实践、项目模板、之前的类似任务经验

3️⃣ Tool Use（工具调用）
   → 调用 `create_project()` 创建文件夹
   → 调用 `write_file()` 写入 App.jsx、index.css
   → 调用 `run_command()` 执行 npm install

4️⃣ Reflection（反思）
   → 检查：编译是否成功？功能是否完整？
   → 发现错误：缺少 useState 导入 → 自动修复 → 重新编译
   → 最终输出：可运行的完整项目

1.4 Context Building（上下文构建）

上下文窗口管理：控制 token 使用，避免超限
信息聚合 & 筛选：从海量信息中提取关键内容
相关检索增强：RAG 技术，动态注入相关知识
Prompt 构建优化：智能组装 system/user/assistant 消息

Context Building 的重要性

这个模块之所以关键，是因为：

解决 LLM 上下文窗口限制：不能把所有历史都塞进去，需要智能压缩和筛选
提升推理质量：注入相关知识（如项目文档、API 规范）能显著提升输出质量
降低 Token 成本：只传递必要信息，避免浪费
保持连贯性：在多轮对话中维持任务上下文的一致性

用户："继续优化刚才的代码"

Context Building 需要：
1. 从 Memory 检索：刚才的代码版本、用户偏好
2. 从知识库检索：相关最佳实践、性能优化技巧
3. 压缩历史对话：保留关键决策点，丢弃冗余信息
4. 构建 Prompt：system(角色) + context(项目信息) + user(当前请求)
5. 注入到 LLM，生成优化建议

二、🧰 Harness（支撑层）：运行时操作系统

2.1 🔑 核心定义

Harness 是 Agent 的「控制平面」和「安全基础设施」
它不产生智能，而是让 Agent 安全、可靠、可观测地执行任务。

2.2 五大核心模块

模块	职责	具体例子
🔌 Tool Abstraction（工具抽象）	统一接口、参数校验、错误处理	把不同的 API（GitHub、Slack、数据库）封装成统一的 `call_tool(name, params)` 格式
🛡️ Guardrails（安全护栏）	输入/输出过滤、策略执行、安全检查	阻止 `rm -rf /*`、过滤敏感信息、限制 API 调用频率、防止幻觉输出
State Management（状态管理）	持久化、检查点、恢复、版本控制	保存任务进度、支持断点续传、记录操作历史、回滚到之前状态
📦 Sandbox（沙箱隔离）	执行隔离、资源限制、容器化	在 Docker 容器中运行代码、限制 CPU/内存、防止访问宿主机文件系统
🔍 Observability（可观测性）	追踪、日志、指标、评估、调试	记录每一步操作、生成 Trace ID、监控性能、评估 Agent 表现、调试错误

2.3 🌰 Harness 完整工作流示例：安全防护层

Agent 请求："执行代码生成并运行测试"

1️⃣ Guardrails（护栏检查）
   → 输入验证：代码是否包含危险命令？（如 rm -rf、sudo）
   → 策略检查：是否有权限执行此操作？是否符合安全策略？
   → 发现危险：代码中包含 `process.exit()` → 拦截并警告

2️⃣ Sandbox（沙箱执行）
   → 隔离环境：在 Docker 容器中运行代码
   → 资源限制：限制 CPU 使用率 50%、内存 512MB、执行时间 30 秒
   → 网络隔离：禁止访问外部网络，只能调用白名单 API

3️⃣ State Management（状态保存）
   → 检查点：每完成一个步骤保存进度
   → 持久化：记录文件变更、环境变量、执行结果
   → 恢复能力：如果崩溃，可从最后一个检查点恢复

4️⃣ Observability（可观测性）
   → 追踪：生成唯一 Trace ID，关联所有操作
   → 日志：记录输入、输出、错误、性能指标
   → 评估：计算成功率、响应时间、资源消耗
   → 调试：提供可视化面板，可回放整个执行过程

最终输出：安全可控的执行结果 + 完整审计报告

三、两者关系：协同工作

用户任务 → Agent（智能决策） → Harness（安全执行） → 结果返回

Agent 负责："做什么、怎么做"
Harness 负责："安全地做、可控地做、可追溯地做"

3.1 🌰 协同示例：自动化部署流程

阶段	Agent 职责	Harness 职责
准备	规划部署步骤、选择目标环境	验证权限、检查环境配置
执行	调用部署工具、上传代码	沙箱隔离、资源限制、进度保存
监控	检查部署状态、验证功能	记录日志、监控指标、异常告警
回滚	决定是否需要回滚、执行回滚	恢复检查点、清理资源、审计追踪

四、💡 关键认知总结

Agent 的核心价值

自主性：不需要人类一步步指导，能自己规划执行
适应性：能根据反馈调整策略，自我修正
工具使用：能调用外部工具完成实际任务

Harness 的核心价值

安全性：防止 Agent 造成破坏（删文件、泄露数据、无限循环）
可靠性：确保任务能稳定完成，支持失败恢复
可观测性：让黑盒操作变得透明，便于调试和优化

为什么 Harness 现在更重要？

企业落地第一道坎：没有 Harness，Agent 就是”不可控的野兽”
合规要求：金融、医疗等行业必须审计每一步操作
规模化前提：只有Harness 成熟，才能放心部署多个 Agent

五、🎯 一句话区分

Agent 是「大脑 + 手脚」（能思考能行动）
Harness 是「安全带 + 黑匣子 + 隔离舱」（确保行动安全可控可追溯）

两者结合，才能构建出真正可用、可信赖、可规模化的 AI Agent 系统。