跳转至

本体驱动上下文架构

核心结论

OrgReOrg / Harness 最终沉淀的不是一个普通知识库,也不是一组并列的 L1/L2/L3/L4 资料层,而是一套 本体驱动的上下文管理系统

它的核心结构只有三块:

text Evidence 原始证据层 -> Ontology 本体层 -> Runtime Projection 运行时投影层

Evidence 负责保真和追溯;Ontology 负责把组织里的对象、关系、规则、制品和能力统一建模;Runtime Projection 负责在用户、任务和权限约束下,给 Agent 组合最小充分上下文。

三层结构

Evidence:原始证据层

Evidence 保存原始上下文和外部资料,不把它们随意摘要成最终事实。

典型来源包括:

  • 企业微信聊天记录、群聊上下文、应用消息、回调事件。
  • 会议记录、文档、审批、表格、附件、截图。
  • 外部网页链接、文章、明确指向但没有永久 URL 的外部资料。
  • GitHub repo、issue、PR、commit、压缩包、代码片段。
  • 财务、CRM、项目管理、BI、文档系统等业务系统对象。

这一层的核心字段是来源、作者、时间、权限、hash、版本、source uri、采集方式和可追溯引用。原始资料可以被索引、切片、清洗和投影,但不能被搜索索引或 Markdown 摘要取代。

Ontology:本体层

Ontology 是组织的语义操作模型。它不是单独一张图,也不是只有实体分类,而是统一描述:

类型 说明
Metadata 来源、作者、时间、权限、版本、hash、置信度、review 状态、生命周期
Object 人、部门、角色、项目、任务、文档、代码仓库、政策、流程、知识卡片、队列
Relationship 负责、归属、依赖、证明、引用、替代、审批、产出、进入队列
Artifact Markdown wiki、ADR、实验报告、项目页、FAQ、路线图、发布文档
Skill 任务技能包、Workflow、Playbook、Agent 操作规范、验证脚本
Rule 权限、可见范围、生命周期、敏感级别、审批、脱敏、频率限制
Action search、read、ask、review、promote、reindex、connector writeback
Writeback 工具结果、回调、review 结论、成本、失败、权限决策和审计事件

所以 Markdown、Skill、索引元数据、权限视图和知识卡片都不是本体层外面的零散东西,而是本体中的不同对象类型和关系类型。

P0 不要求建设大而全知识图谱,也不要求立刻上图数据库。当前采用 domain-topology.json、ontology registry、Markdown、ADR、experiment registry 和 task skill manifest 作为轻量本体表示;当数据量和协作复杂度上升后,再评估图数据库、OpenSearch graph-like join、Postgres 关系表或专门 ontology service。

Runtime Projection:运行时投影层

Agent 执行任务时不应该直接读取完整本体。Runtime Projection 根据:

  • 当前用户。
  • 当前任务。
  • 当前权限。
  • 组织拓扑。
  • 上下文新鲜度。
  • 成本预算。
  • 可用工具和连接器。

从本体中投影出一个最小上下文包。

这个上下文包可以包含:

  • 任务指令和适用 Skill。
  • 少量高价值 Markdown / ADR / 实验报告。
  • SearchConnector 返回的证据片段和 rank log。
  • Tool Gateway 净化后的业务对象。
  • 主动询问生成的 pending knowledge card。
  • 权限裁剪后的原始证据引用。

目标函数不是“召回越多越好”,而是:

text minimize(context_tokens + irrelevant_noise + permission_risk) subject to: enough_evidence_for_task = true required_permissions_satisfied = true provenance_is_traceable = true knowledge_gaps_are_explicit = true

运行时披露不是知识形态

此前文档里的 L0-L5 容易被误读成知识形态分层。现在统一改成运行时披露路径:

运行时步骤 作用 典型实现
D0 当前任务上下文 当前问题、计划、最近证据和正在编辑的文件 Codex / Claude 当前会话
D1 入口索引 告诉 Agent 该读什么、用什么 Skill、受什么规则约束 AGENTS.md、task skill manifest、项目导航
D2 稳定知识制品 人和 Agent 都可读的高价值知识表达 docs、vault wiki、ADR、实验报告、runbook
D3 检索投影 面向大规模资料的候选召回和排序 Postgres FTS/pgvector、OpenSearch/ES、BM25、embedding
D4 证据读取 按权限回查原始资料或业务系统对象 Connector、MCP、API、raw vault、source snapshot
D5 主动补充 当证据不足时询问人或系统并写回本体 Ask Router、企业微信、knowledge card、callback ledger

这条路径表达的是 Agent 先看什么、再搜什么、最后追溯什么。它不表示原始资料比 Markdown “更高层”,也不表示 Skill 只是 L1/L2 附件。原始资料始终属于 Evidence;Markdown 和 Skill 属于 Ontology 的制品和能力对象;搜索、总线、MCP 和企微消息是 Runtime Projection 的实现手段。

与旧 L2/L3/L4/L5 口径的关系

旧口径里的技术点仍然是 P0/P1 的主要攻关对象,只是不再作为知识形态主模型:

旧口径 保留的技术含义 新模型中的定位
L2 Markdown / docs / vault 人和 Agent 都能 review、阅读、链接和维护的稳定知识表达 Ontology artifact;运行时通常通过 D2 读取
L3 ES / OpenSearch / Postgres / embedding 大规模候选召回、排序、rank log、权限和 stale projection 验证 Runtime Projection 的 D3 检索投影
L4 源系统 / 原始材料 / Connector 企微、会议、业务系统、GitHub、网页、附件等权威证据 Evidence;运行时通过 D4 Connector / MCP 回查
L5 人与组织网络 负责人、审批人、项目 owner、主动询问对象 Ontology object / relationship;运行时通过 D5 Ask Router 主动补充

因此后续研发计划仍要重点攻克 D2/D3/D4/D5,只是每个技术点都必须能说明它服务的是 Evidence、Ontology 还是 Runtime Projection。

当前 Repo 的映射

仓库位置 在新模型中的含义
vault/10-raw/ Evidence 原始资料和外部来源记录
vault/00-inbox/ 尚未稳定归类的 capture 队列
domain/orgreorg-demo/evidence-registry.json Evidence source snapshot、hash、临时链接状态、PII/mask 和 downstream artifact contract
vault/20-wiki/vault/30-projects/vault/40-decisions/ Ontology 中的可读知识制品
docs/ 发布给团队阅读的稳定知识投影
framework/task_skills/packages/ Ontology 中的可执行知识对象
domain/orgreorg-demo/domain-topology.json 当前 Demo 的组织本体和私域拓扑 contract
domain/orgreorg-demo/project-status.json 项目运行状态的结构化本体对象
domain/orgreorg-demo/experiment-reports.json 实验报告 registry 和研用测证据索引
framework/context/search_connector.py D3 检索投影 adapter contract
framework/governance/*gateway*.py Runtime action 的权限、规则、审计和输出净化
framework/workflows/ask_router.py D5 主动补充和人员询问投影

对技术路线的影响

  1. ES / OpenSearch / Postgres 不是知识源,而是 Runtime Projection 的索引和召回实现。
  2. Markdown 不是低级资料,而是本体对象的可读表达,适合审查、发布和渐进披露。
  3. Skill 不是 Markdown 的旁支,而是本体中的可执行能力对象,应该关联任务、工具、证据、权限和验证。
  4. 原始资料不再被放到所谓 L4;它们统一归入 Evidence,并通过 provenance 被所有上层对象追溯。
  5. Context Router 的目标是投影最小充分上下文,而不是路由到一个全局搜索服务。
  6. Tool Gateway、Ontology Tool Gateway、Callback Ledger 和 Permission View 是本体规则进入运行时的安全边界。
  7. 研用测一体意味着每次讨论、资料、实验、失败和修正都要进入 Evidence / Ontology / Runtime 的循环。

当前 P0 边界

P0 只做轻量可验证版本:

  • Evidence 用 vault/10-raw/、inbox、Evidence Registry、source uri 和 hash 记录。
  • Ontology 用 domain-topology.json、ontology registry、project status、experiment registry、ADR 和 task skill manifest 表达。
  • Runtime Projection 用本地 Context Router、SearchConnector、Tool Gateway、Ask Router、Knowledge Card 和 No-WeCom Demo 验证。

暂不做完整图数据库、完整 MVC 权限系统、真实企业微信 adapter 和真实外部业务系统写回。这些是后续把当前 MVP 产品化时的扩展点。