A2A, ACP, AI Agent, OpenClaw, Ping-Pong, 多 Agent, 源码解读

2026-03-29

...

整站

OpenClaw Agent 协作全景解析

Agent 协作解析：spawn、send、ACP、subagent 与 Ping-Pong 的关系与限制

源码路径: ~/WorkBuddy/20260327195403/openclaw
关键文件: src/agents/acp-spawn.ts、src/agents/tools/sessions-send-tool.ts、src/agents/tools/sessions-send-tool.a2a.ts、src/agents/tools/sessions-send-helpers.ts、src/agents/tools/sessions-spawn-tool.ts、src/agents/tools/sessions-helpers.ts、src/acp/policy.ts、src/plugins/config-state.ts

一、背景与问题

在多 Agent 系统中，Agent 之间的协作方式决定了整个系统的灵活性、可靠性和可维护性。OpenClaw 作为一个支持多 Channel（Discord、Telegram、飞书、微信等）的 Agent 网关框架，提供了一套完整的 Agent 协作机制。然而，这套机制涉及多个容易混淆的概念：

sessions_spawn 和 sessions_send 是什么关系？
subagent 和 ACP 有什么区别？它们是互斥的吗？
A2A（Agent-to-Agent）到底是什么？
Ping-Pong 协商机制在什么时候触发？
Thread Binding 对微信 Channel 为什么不可用？
mode: "run" 和 mode: "session" 如何选择？

本文从 OpenClaw 源码出发，用一张架构图把这些概念的关系讲清楚，然后逐一深入定义、对比、分析限制，最后给出实践决策建议。

先给出最佳实践！
可以利用拆分多步骤 spawn 子agent + Ping-Pong 协商机制让子agent 分步骤汇报，以防止走偏而无感知。

拆分 spawn + Ping-Pong 是最佳”防走偏 + 汇报”方案

注意⚠️：每次 spawn（run 模式）是一个全新 Session，子agent 没有上一步的记忆。
可以用 mode: “session” 保持 Session（微信上用 subagent + session + thread: false）

注意⚠️⚠️⚠️⚠️⚠️：mode=”session” 必须搭配 thread=true 【上一条是错的，大模型真离谱！！！】
所以只能是 mode=”run” 的spawn + Ping-Pong 协商，实现子Agent的进度上报，以实现可控、防止走偏无感知。

1
2
3

spawn({ mode: "session", task: "设计 Schema" })  → 创建常驻 Session
send({ message: "根据刚才的 Schema 写代码" })     → 有上下文
send({ message: "补充单元测试" })                 → 有完整上下文

二、架构全景图

了解协作机制是为了让我们更好懂OpenClaw，更好的调教OpenClaw

人到Agent、Agent之间协作通常涉及有两个核心阶段：创建 Session（spawn）、Session 间通信（send/A2A）
创建 Session（spawn）支持两种方式：subagent、ACP
sessions_spawn 有两种模式：mode: “run”、mode: “session”
Thread 是把一个子 Session 绑定到一个聊天线程的机制。适用于每个 Agent 独立 Thread，用户直接对话。

这张图展示了一个核心认知：OpenClaw 的 Agent 协作分为三个独立阶段——创建 Session（spawn）、Session 间通信（send/A2A）、通信后协商（Ping-Pong）——它们各自解决不同的问题，彼此正交，可以自由组合。

三、核心概念定义

3.1 sessions_spawn：创建子 Session

sessions_spawn 是一个 Tool，允许一个 Agent 在其 Tool Loop 中创建新的子 Session。它有两个关键参数决定子任务的运行方式：

runtime: 决定子 Agent 怎么跑。可选 subagent（默认，嵌入式）或 acp（独立进程）。
mode: 决定子 Session 的生命周期。可选 run（一次性）或 session（常驻）。
thread: 决定是否绑定到聊天线程，影响回复的投递目标。

源码定义在 sessions-spawn-tool.ts 中，SESSIONS_SPAWN_RUNTIMES = ["subagent", "acp"] 明确了两种互斥的运行时类型。

3.2 sessions_send（A2A）：向已有 Session 发消息

sessions_send 是一个 Tool，允许一个 Agent 向另一个已存在的 Session 发送消息。它的核心特征是不创建 Session——如果目标 Session 不存在，会直接报错 No session found with label: xxx。

源码定义在 sessions-send-tool.ts 中。当消息发送成功后，会自动触发后台的 A2A 流程（Ping-Pong + Announce）。

A2A 需要配置权限，通过 tools.agentToAgent.enabled = true 和 tools.agentToAgent.allow 白名单控制。

3.3 subagent：嵌入式运行时

subagent 是 sessions_spawn 的默认运行时。子 Agent 运行在 OpenClaw 进程内部，作为父 Agent 的一个函数调用执行。它自动继承父 Agent 的 workspace，支持 attachments 和 model 覆盖，轻量无独立进程开销。

3.4 ACP（Agent Communication Protocol）：独立进程运行时

ACP 是另一种运行时选择。子 Agent 作为一个独立的 CLI 进程（如 claude、codex）被 spawn 出来，通过标准输入/输出与 OpenClaw Gateway 通信。它需要 acpx 插件提供运行时 backend，支持 session resume 和 stream 输出，但需要额外配置且占用独立进程资源。

3.5 Ping-Pong：A2A 的自动协商机制

Ping-Pong 是 sessions_send 完成后的后台异步流程。当 Agent A 向 Agent B 发送消息并收到回复后，OpenClaw 会自动在 A 和 B 之间来回传递消息，让双方有机会补充和确认，直到某方回复 REPLY_SKIP 或达到最大轮数（默认 5 轮）。

从源码 sessions-send-tool.a2a.ts 可以看到，Ping-Pong 的触发条件只依赖三个因素：maxPingPongTurns > 0、有发起方 Session、目标不是自己。它不关心 Session 是 subagent 还是 ACP 创建的，也不依赖 Thread Binding。

3.6 Thread Binding：聊天线程绑定

Thread Binding 是一种将子 Session 绑定到特定聊天线程（如 Discord 帖子、Telegram 话题）的机制。绑定后，子 Agent 的回复会直接投递到该线程，而非发起方的 Channel。只有 Discord、Telegram、飞书、Matrix 四个 Channel 实现了 Thread Binding adapter，微信（openclaw-weixin）不支持。

3.7 mode: “run” vs mode: “session”

mode 控制子 Session 的生命周期。run 模式下子 Session 处理完一个任务后立即结束，资源释放，不能再用 sessions_send 往里面发消息。session 模式下子 Session 保持活跃，可以反复通过 sessions_send 继续交互，子 Agent 保留完整的历史上下文。

四、多维度对比

4.1 sessions_spawn vs sessions_send

维度	sessions_spawn	sessions_send
本质	创建新的子 Session	向已有 Session 发消息
前置条件	Agent 在 `agents.list` 中有定义	目标 Session 必须已存在
是否创建 Session	是	否
runtime 参数	`subagent` / `acp`	不涉及（Session 已确定）
mode 参数	`run` / `session`	不涉及
thread 参数	支持	不涉及
典型用途	初始化子任务	后续交互、补充需求

两者是”建房间”和”进房间说话”的关系。必须先 spawn 创建 Session，然后才能 send 向其发消息。

4.2 subagent vs ACP

维度	subagent	ACP
本质	嵌入式运行时	独立进程运行时
运行位置	OpenClaw 进程内	独立 CLI 进程
workspace	自动继承父 Agent	需要指定或从 binding 读取
attachments	支持	不支持（报错）
resumeSessionId	不支持	支持（恢复已有 CLI 会话）
streamTo	不支持	支持（流式输出到父 Agent）
model 覆盖	支持	不支持（由 CLI 进程决定）
依赖	无	需要 acpx 插件
资源开销	轻量	重量级（独立进程）

两者是 sessions_spawn 的两种互斥运行时选择，解决”子任务怎么跑”的问题，与通信方式（A2A）无关。

4.3 mode: “run” vs mode: “session”

维度	mode: “run”	mode: “session”
生命周期	处理完即退出	保持活跃
后续 sessions_send	不可能（Session 已结束）	支持（保留上下文）
资源占用	用完即释放	持续占用
典型场景	搜索、翻译、一次性分析	编码项目、长期协作
ACP + thread:false	允许	硬性禁止（源码强制约束）

4.4 Thread Binding 限制矩阵

组合	可用性	说明
subagent + run + thread=false	可用	所有 Channel
subagent + run + thread=true	需 Channel 支持	Discord/Telegram/飞书/Matrix
subagent + session + thread=false	禁止	源码硬约束，直接报错
subagent + session + thread=true	需 Channel 支持	Discord/Telegram/飞书/Matrix
ACP + run + thread=false	可用	所有 Channel（需 acpx）
ACP + run + thread=true	需 Channel 支持	Discord/Telegram/飞书/Matrix
ACP + session + thread=false	禁止	源码硬约束，直接报错
ACP + session + thread=true	需 Channel 支持	必须绑定 Thread

关键约束来自 acp-spawn.ts 第 733-737 行：当 mode="session" 且 thread 不为 true 时，直接返回错误。这是因为常驻 ACP 进程需要一个 Thread 来持续投递回复，没有 Thread 绑定则回复无处可去。

4.5 Ping-Pong 与其他概念的关系

维度	关系
与 subagent/ACP	完全无关，不关心 Session 的运行时类型
与 Thread Binding	完全无关，Ping-Pong 在 Gateway 内部通过 `agent.run` 执行
与 mode	完全无关，只操作已有 Session
与 sessions_send	Ping-Pong 是 send 的后处理流程，自动触发
触发条件	`maxPingPongTurns > 0` + 有发起方 + 目标不是自己
终止条件	某方回复 `REPLY_SKIP` 或达到轮数上限
配置位置	`session.agentToAgent.maxPingPongTurns`（默认 5，设为 0 关闭）

五、完整生命周期

一次典型的多 Agent 协作包含四个阶段：

阶段一：创建 Session（sessions_spawn）

Agent A 在 Tool Loop 中调用 sessions_spawn，根据任务性质选择 runtime（subagent 或 ACP）和 mode（run 或 session）。子 Agent 在新的 Session 中处理初始任务，返回结果给 Agent A。

阶段二：发送消息（sessions_send / A2A）

Agent A 调用 sessions_send 向已创建的 Session 发送消息。Gateway 通过 sessions.resolve 找到目标 Session，检查 A2A 权限后触发 agent.run，目标 Agent 处理消息并回复。

阶段三：自动协商（Ping-Pong）

sessions_send 返回后，后台自动启动 Ping-Pong 流程。Gateway 把目标 Agent 的回复发给发起方 Agent，让发起方判断是否满意；如果需要补充，再把补充内容发回目标 Agent。如此来回最多 5 轮，直到某方回复 REPLY_SKIP 或达到上限。整个过程对用户透明。

阶段四：投递结果（Announce）

Ping-Pong 结束后，Gateway 把最终结果发给目标 Agent 做最后确认（可通过 ANNOUNCE_SKIP 保持沉默），然后根据 Thread 绑定状态投递到对应位置——有 Thread 则投递到 Thread，没有则投递到发起方的 Channel。

六、常见错误与排查

6.1 “No session found with label: xxx”

sessions_send 找不到目标 Session。sessions_send 不会自动创建 Session，必须先通过 sessions_spawn 或 bindings 路由创建。检查目标 Agent 的 label 是否正确，Session 是否已经被关闭。

6.2 “Thread bindings are unavailable for openclaw-weixin”

微信 Channel 不支持 Thread Binding。解决方案：使用 thread: false 参数，或改用支持 Thread Binding 的 Channel（Discord/Telegram/飞书/Matrix）。微信上推荐 runtime: "subagent" + thread: false。

6.3 “ACP runtime backend is not configured”

ACP 运行时需要 acpx 插件，且该插件默认不在启用列表中。解决方案：在 openclaw.json 中添加 "plugins": { "entries": { "acpx": { "enabled": true } } } 并配置 "acp": { "backend": "acpx" }。

6.4 ACP + session + thread=false 报错

这是源码硬约束。ACP 的 mode: "session"（常驻模式）必须配合 thread: true，因为常驻进程需要 Thread 来持续投递回复。如果 Channel 不支持 Thread Binding，则无法使用 ACP 的常驻模式，只能用 mode: "run" 或改用 subagent。

七、实践决策指南

7.1 选择 runtime：subagent 还是 ACP？

默认选 subagent。它轻量、无额外依赖、自动继承 workspace，覆盖绝大多数场景。只有在以下情况才考虑 ACP：

需要独立开发环境（文件系统隔离）
需要 resume 之前的编码会话
需要流式输出到父 Agent

7.2 选择 mode：run 还是 session？

一次性任务选 run，多轮交互选 session。判断标准是：后续是否需要通过 sessions_send 继续往这个 Session 发消息、是否需要子 Agent 保持历史上下文。

7.3 是否开启 Thread？

如果 Channel 支持（Discord/Telegram/飞书/Matrix），且希望子 Agent 的回复直接投递到特定线程（而非发起方 Channel），则开启。否则不需要。

7.4 微信 Channel 的推荐配置

由于微信不支持 Thread Binding，推荐以下组合：

// 一次性任务
sessions_spawn({
  agentId: "magerd",
  label: "magerd",
  task: "用户的请求",
  runtime: "subagent",
  mode: "run",
  thread: false
})

// 需要多轮交互
sessions_spawn({
  agentId: "magerd",
  label: "magerd",
  task: "初始任务",
  runtime: "subagent",
  mode: "session",
  thread: false
})
// 后续通过 sessions_send({ label: "magerd", message: "..." }) 继续交互

7.5 ACP 配置检查清单

如果需要使用 ACP 模式，确保以下配置到位：

plugins.entries.acpx.enabled = true（启用 acpx 插件）
acp.backend = "acpx"（指定 ACP backend）
tools.agentToAgent.enabled = true（开启 A2A 权限）
tools.agentToAgent.allow 包含相关 Agent ID（白名单）
Channel 支持 Thread Binding（如果使用 mode: "session"）

八、总结

OpenClaw 的 Agent 协作机制可以用一句话概括：spawn 创建 Session，send 使用 Session，Ping-Pong 协商结果，Announce 投递给用户。subagent 和 ACP 是 spawn 时的运行时选择，run 和 session 是生命周期选择，Thread Binding 是投递路由选择，Ping-Pong 是通信后处理选择——它们各自独立、正交互补，共同构成了一套灵活而完整的 Multi-Agent 协作框架。

参考

OpenClaw 源码 — src/agents/acp-spawn.ts, src/agents/tools/sessions-send-tool.ts, src/agents/tools/sessions-send-tool.a2a.ts
OpenClaw 多 Agent 持久化交互与 Channel-Agent 协作机制深度解读
OpenClaw 架构深度解读：核心运行机制