企微分层接入:主动知识沉淀 MVP 与会话存档增强¶
本页是团队可读摘要,来源为 2026-06-16 两份 raw evidence 调研报告和同日更新的产品路线判断。原始报告保留在 Evidence 层;本站只保留可发布、脱敏、可执行的路线结论。
从网站首页的“当前重点入口”或“正式方案 -> 企微分层接入方案”可以找到本页。本页回答:当前 MVP 在不启用会话内容存档时能覆盖哪些企微知识库入口、不同场景应该走哪条能力、什么时候才需要把会话内容存档作为增强项开通。
核心判断:当前 MVP 不把会话内容存档作为企微方案可用的前置条件。需要进入团队知识库的消息,默认由团队成员主动 @Bot、私聊 Bot、转发给 Bot,或写入指定文档/日报入口。会话内容存档只在需要“不 @ 也采集普通群聊/单聊、历史回溯、合规归档、媒体下载、seq/cursor checkpoint”时再作为全量被动采集增强项开通。
主结论¶
正式路线按场景和需求分四层:
- 人机实时交互:生产入口优先智能机器人 Bot URL 回调;开发、smoke、回归和临时对话保留 Bot WS 长连接。该层覆盖私聊 Bot、群里 @Bot、被动回复、主动回复,以及已保存
chatid的主动群消息。 - 显式知识沉淀:MVP 默认采集策略。团队约定“需要入库就主动提交”:@Bot、私聊 Bot、转发给 Bot,或写入指定文档/日报。Harness 只把这些显式提交内容登记为 Evidence,再进入 review、Knowledge Card 或发布流程。
- 企业系统能力:自建应用 API/回调负责通讯录、部门成员、权限、文档/日报、会议、应用消息和主动提醒。这是企业级集成与写回通道,不是普通聊天历史采集通道。
- 全量被动采集:会话内容存档降级为未来增强项。只有当需求明确包含不 @ 也采集普通群聊/单聊、历史消息、合规审计、媒体下载或 seq/cursor checkpoint 时,才启动会话内容存档或等价企业会话内容能力。
智能机器人 URL 回调可以在有公网 HTTPS 后替代生产常驻 Bot WS,但不能替代自建应用/API。自建应用/API 可以覆盖企业系统集成和主动提醒,但不能替代会话内容存档的全量被动采集。会话内容存档很重要,但不是当前 MVP 验收的必需项。
场景矩阵¶
| 场景 / 需求 | 当前路线 | 当前 MVP 是否依赖会话内容存档 | 说明 |
|---|---|---|---|
| 成员私聊 Bot 提交问题、日报、结论或待入库材料 | Bot URL 回调;开发/回归用 Bot WS | 否 | 成员主动提交即作为显式 Evidence 来源。 |
| 群里 @Bot 让 Harness 记录关键讨论、生成任务或知识卡片 | Bot URL 回调;开发/回归用 Bot WS | 否 | 只采集 @Bot 触发的消息,不采集未 @ 的普通群聊。 |
| Bot 在会话中被动回复或继续追问 | Bot URL 回调 / Bot WS 回复能力 | 否 | 回复内容进入 callback ledger 和审计摘要,不保存真实敏感原文。 |
Bot 向已保存 chatid 的群主动发送提醒 |
智能机器人主动消息能力,需按群场景实测 | 否 | 只在 chatid 已由合法交互保存且权限允许时使用。 |
| 主动通知成员、补充询问、状态提醒 | 自建应用 message/send 或等价应用消息 |
否 | 默认归入自建应用/API 主通道,便于 access_token、频控和权限审计。 |
| 通讯录、部门成员、权限视图、成员映射 | 自建应用 API / 通讯录权限 | 否 | 替换本地 registry 来源,不采集团队普通聊天内容。 |
| 文档、日报、智能表格、微盘、会议资料 | 自建应用 API、企业微信文档/汇报/会议等接口 | 否 | 指定文档/日报入口也是 MVP 显式知识沉淀的一部分。 |
| 不 @Bot 也采集团队普通群聊或成员工作单聊 | 会话内容存档 / 等价企业会话能力 | 是 | 属于全量被动采集、历史回溯或合规审计增强项。 |
| 历史消息、媒体下载、seq/cursor checkpoint、长期归档 | 会话内容存档 SDK / 企业会话内容能力 | 是 | 需要开通、范围、告知、密钥、SDK、restricted Evidence 和访问审计。 |
MVP 采集约定¶
MVP 的默认规则是“主动提交才入库”:
- 群内讨论需要沉淀时,团队成员 @Bot,并在消息里写清要记录的结论、任务、风险或待确认问题。
- 私聊 Bot 可提交个人日报、问题、补充说明、会议结论或文件线索。
- 重要消息可以转发给 Bot,由 Bot 生成脱敏 Evidence 摘要和待 review Knowledge Card。
- 指定文档、日报、汇报或表格入口作为稳定输入源,由自建应用/API 或相邻企业级 API 拉取。
- 未经主动提交或指定入口进入的普通聊天,不作为 MVP 默认采集对象。
这条规则牺牲了“全量自动抓取”,但降低了合规、成本、权限和上线复杂度,足以覆盖团队知识库入口的大部分主动能力。
配合清单¶
管理员:
- 为智能机器人生产 URL 回调准备公网 HTTPS 回调地址;Bot WS 只用于开发、smoke、回归和临时对话。
- 确认机器人可见范围、成员私聊入口、目标群添加方式和群 @ 使用约定。
- 创建或选择自建应用,配置可见范围、回调 URL、Token、EncodingAESKey、企业可信 IP 和应用消息权限。
- 开通通讯录、企业微信文档、微盘、汇报、会议等 MVP 所需接口权限。
- 暂不把会话内容存档列为当前 MVP 必配项;只有进入全量被动采集增强阶段时,再发起试点开通、范围配置和 RSA 公钥配置。
运维/安全:
- 提供国内公网入口、DNS、证书、443、反代、健康检查和固定出口 IP。
- 确认企业微信 API 的实际出口 IP 已可白名单。
- 托管 Secret、Token、EncodingAESKey 等凭证,日志默认脱敏。
- 只有启用会话内容存档时,才新增 RSA 私钥、SDK 凭证、媒体拉取和 seq/cursor checkpoint 的安全托管。
法务/HR:
- MVP 阶段重点确认主动提交、指定文档/日报入口和应用消息提醒的内部使用告知。
- 如果后续启用会话内容存档,再补充员工告知、制度依据、客户或外部联系人同意策略、留存周期、删除和访问审计机制。
业务/试点团队:
- 约定哪些内容需要 @Bot、私聊 Bot、转发 Bot 或写指定文档/日报。
- 提供测试群、测试成员、测试文档/表格/汇报模板和测试会议。
- 首轮验收只使用 synthetic 内容,确认哪些内容可进入 Knowledge / Site。
会话内容存档何时开通¶
以下需求出现时,再把会话内容存档作为单独增强项目评估:
- 希望不 @Bot 也自动采集部门群普通消息。
- 希望采集授权成员之间的工作单聊。
- 希望回溯历史窗口内消息或长期合规归档。
- 希望下载聊天里的媒体、文件或语音等内容。
- 需要按
seq/cursor做 checkpoint、补拉、去重和审计。
开通前置仍然严格:
- 试点范围、员工告知、审批和留存策略明确。
- RSA 公钥、私钥托管、存档 Secret、可信 IP 和 SDK 拉取服务准备完成。
- 原始消息先进入 restricted Evidence,不直接进入 Knowledge、Site 或普通 Agent 上下文。
- 媒体下载、解密、hash、访问审批和审计闭环通过。
WireGuard 网络原则¶
- 企业微信公网回调入口使用国内公网入口,不依赖 WireGuard。
- 企业微信 API 默认绕过 WireGuard,通过固定国内 NAT/EIP 出口。
- 国际模型、海外依赖和外部检索流量可以走 WireGuard,但不能改变企业微信回调回包路径。
- 如果默认路由必须走 WireGuard,需要用 split tunnel、policy routing 或独立主机/容器确保 443 回包从公网入口返回。
- 如果后续启用会话内容存档,SDK 出口 IP 也必须固定、可白名单,并稳定访问企业微信接口。
Go / No-Go 里程碑¶
Go P1:
- 公网 443 可达。
- 智能机器人 URL 回调完成生产入口验证;Bot WS 继续作为开发/回归入口。
- 私聊 Bot、群 @Bot、被动回复和安全投影通过。
- MVP 显式知识沉淀约定已写入团队说明:@Bot、私聊 Bot、转发 Bot、指定文档/日报入口。
Go P2:
- 自建应用
GET /wecom/callbackURL 验证通过。 - 自建应用
POST /wecom/callback合成或真实测试事件可验签、解密、入 callback ledger。 - access_token、应用消息发送、通讯录最小字段同步和主动提醒通过。
Go P3:
- 测试文档、智能表格、微盘、汇报或会议对象完成一次 synthetic 最小读写或最小拉取。
- 所有写入可审计、可回滚,不包含真实敏感内容。
Go P4(增强项):
- 会话内容存档试点范围、员工告知和审批完成。
- RSA 私钥安全托管,SDK 能拉取并解密 synthetic 文本消息。
- 媒体拉取、seq/cursor checkpoint 和 restricted Evidence 入库通过。
No-Go:
- 把会话内容存档误写成当前 MVP 可用性的前置条件。
- 把智能机器人 URL 回调误当成自建应用/API 或企业系统集成入口。
- 把公网回调误当成全量聊天源。
- 真实凭证、用户 ID、群 ID、消息正文、私钥或回调 payload 进入仓库。
- WireGuard 导致回调回包路径不对称,或企业微信 API 出口 IP 未白名单。
- 启用会话内容存档时缺少合规告知、审批或清晰试点范围。
Evidence¶
workspaces/variai/evidence/raw/2026-06-16-wecom-full-route-feasibility-research.mdworkspaces/variai/evidence/raw/2026-06-16-wecom-full-route-wireguard-plan.md