本体驱动上下文架构¶
核心结论¶
OrgReOrg / Harness 最终沉淀的不是一个普通知识库,也不是一组并列的 L1/L2/L3/L4 资料层,而是一套 本体驱动的上下文管理系统。
它的核心结构只有三块:
text
Evidence 原始证据层
-> Ontology 本体层
-> Runtime Projection 运行时投影层
Evidence 负责保真和追溯;Ontology 负责把组织里的对象、关系、规则、制品和能力统一建模;Runtime Projection 负责在用户、任务和权限约束下,给 Agent 组合最小充分上下文。
三层结构¶
Evidence:原始证据层¶
Evidence 保存原始上下文和外部资料,不把它们随意摘要成最终事实。
典型来源包括:
- 企业微信聊天记录、群聊上下文、应用消息、回调事件。
- 会议记录、文档、审批、表格、附件、截图。
- 外部网页链接、文章、明确指向但没有永久 URL 的外部资料。
- GitHub repo、issue、PR、commit、压缩包、代码片段。
- 财务、CRM、项目管理、BI、文档系统等业务系统对象。
这一层的核心字段是来源、作者、时间、权限、hash、版本、source uri、采集方式和可追溯引用。原始资料可以被索引、切片、清洗和投影,但不能被搜索索引或 Markdown 摘要取代。
Ontology:本体层¶
Ontology 是组织的语义操作模型。它不是单独一张图,也不是只有实体分类,而是统一描述:
| 类型 | 说明 |
|---|---|
| Metadata | 来源、作者、时间、权限、版本、hash、置信度、review 状态、生命周期 |
| Object | 人、部门、角色、项目、任务、文档、代码仓库、政策、流程、知识卡片、队列 |
| Relationship | 负责、归属、依赖、证明、引用、替代、审批、产出、进入队列 |
| Artifact | Markdown wiki、ADR、实验报告、项目页、FAQ、路线图、发布文档 |
| Skill | 任务技能包、Workflow、Playbook、Agent 操作规范、验证脚本 |
| Rule | 权限、可见范围、生命周期、敏感级别、审批、脱敏、频率限制 |
| Action | search、read、ask、review、promote、reindex、connector writeback |
| Writeback | 工具结果、回调、review 结论、成本、失败、权限决策和审计事件 |
所以 Markdown、Skill、索引元数据、权限视图和知识卡片都不是本体层外面的零散东西,而是本体中的不同对象类型和关系类型。
P0 不要求建设大而全知识图谱,也不要求立刻上图数据库。当前采用 domain-topology.json、ontology registry、Markdown、ADR、experiment registry 和 task skill manifest 作为轻量本体表示;当数据量和协作复杂度上升后,再评估图数据库、OpenSearch graph-like join、Postgres 关系表或专门 ontology service。
Runtime Projection:运行时投影层¶
Agent 执行任务时不应该直接读取完整本体。Runtime Projection 根据:
- 当前用户。
- 当前任务。
- 当前权限。
- 组织拓扑。
- 上下文新鲜度。
- 成本预算。
- 可用工具和连接器。
从本体中投影出一个最小上下文包。
这个上下文包可以包含:
- 任务指令和适用 Skill。
- 少量高价值 Markdown / ADR / 实验报告。
- SearchConnector 返回的证据片段和 rank log。
- Tool Gateway 净化后的业务对象。
- 主动询问生成的 pending knowledge card。
- 权限裁剪后的原始证据引用。
目标函数不是“召回越多越好”,而是:
text
minimize(context_tokens + irrelevant_noise + permission_risk)
subject to:
enough_evidence_for_task = true
required_permissions_satisfied = true
provenance_is_traceable = true
knowledge_gaps_are_explicit = true
运行时披露不是知识形态¶
此前文档里的 L0-L5 容易被误读成知识形态分层。现在统一改成运行时披露路径:
| 运行时步骤 | 作用 | 典型实现 |
|---|---|---|
| D0 当前任务上下文 | 当前问题、计划、最近证据和正在编辑的文件 | Codex / Claude 当前会话 |
| D1 入口索引 | 告诉 Agent 该读什么、用什么 Skill、受什么规则约束 | AGENTS.md、task skill manifest、项目导航 |
| D2 稳定知识制品 | 人和 Agent 都可读的高价值知识表达 | docs、vault wiki、ADR、实验报告、runbook |
| D3 检索投影 | 面向大规模资料的候选召回和排序 | Postgres FTS/pgvector、OpenSearch/ES、BM25、embedding |
| D4 证据读取 | 按权限回查原始资料或业务系统对象 | Connector、MCP、API、raw vault、source snapshot |
| D5 主动补充 | 当证据不足时询问人或系统并写回本体 | Ask Router、企业微信、knowledge card、callback ledger |
这条路径表达的是 Agent 先看什么、再搜什么、最后追溯什么。它不表示原始资料比 Markdown “更高层”,也不表示 Skill 只是 L1/L2 附件。原始资料始终属于 Evidence;Markdown 和 Skill 属于 Ontology 的制品和能力对象;搜索、总线、MCP 和企微消息是 Runtime Projection 的实现手段。
与旧 L2/L3/L4/L5 口径的关系¶
旧口径里的技术点仍然是 P0/P1 的主要攻关对象,只是不再作为知识形态主模型:
| 旧口径 | 保留的技术含义 | 新模型中的定位 |
|---|---|---|
| L2 Markdown / docs / vault | 人和 Agent 都能 review、阅读、链接和维护的稳定知识表达 | Ontology artifact;运行时通常通过 D2 读取 |
| L3 ES / OpenSearch / Postgres / embedding | 大规模候选召回、排序、rank log、权限和 stale projection 验证 | Runtime Projection 的 D3 检索投影 |
| L4 源系统 / 原始材料 / Connector | 企微、会议、业务系统、GitHub、网页、附件等权威证据 | Evidence;运行时通过 D4 Connector / MCP 回查 |
| L5 人与组织网络 | 负责人、审批人、项目 owner、主动询问对象 | Ontology object / relationship;运行时通过 D5 Ask Router 主动补充 |
因此后续研发计划仍要重点攻克 D2/D3/D4/D5,只是每个技术点都必须能说明它服务的是 Evidence、Ontology 还是 Runtime Projection。
当前 Repo 的映射¶
| 仓库位置 | 在新模型中的含义 |
|---|---|
vault/10-raw/ |
Evidence 原始资料和外部来源记录 |
vault/00-inbox/ |
尚未稳定归类的 capture 队列 |
domain/orgreorg-demo/evidence-registry.json |
Evidence source snapshot、hash、临时链接状态、PII/mask 和 downstream artifact contract |
vault/20-wiki/、vault/30-projects/、vault/40-decisions/ |
Ontology 中的可读知识制品 |
docs/ |
发布给团队阅读的稳定知识投影 |
framework/task_skills/packages/ |
Ontology 中的可执行知识对象 |
domain/orgreorg-demo/domain-topology.json |
当前 Demo 的组织本体和私域拓扑 contract |
domain/orgreorg-demo/project-status.json |
项目运行状态的结构化本体对象 |
domain/orgreorg-demo/experiment-reports.json |
实验报告 registry 和研用测证据索引 |
framework/context/search_connector.py |
D3 检索投影 adapter contract |
framework/governance/*gateway*.py |
Runtime action 的权限、规则、审计和输出净化 |
framework/workflows/ask_router.py |
D5 主动补充和人员询问投影 |
对技术路线的影响¶
- ES / OpenSearch / Postgres 不是知识源,而是 Runtime Projection 的索引和召回实现。
- Markdown 不是低级资料,而是本体对象的可读表达,适合审查、发布和渐进披露。
- Skill 不是 Markdown 的旁支,而是本体中的可执行能力对象,应该关联任务、工具、证据、权限和验证。
- 原始资料不再被放到所谓 L4;它们统一归入 Evidence,并通过 provenance 被所有上层对象追溯。
- Context Router 的目标是投影最小充分上下文,而不是路由到一个全局搜索服务。
- Tool Gateway、Ontology Tool Gateway、Callback Ledger 和 Permission View 是本体规则进入运行时的安全边界。
- 研用测一体意味着每次讨论、资料、实验、失败和修正都要进入 Evidence / Ontology / Runtime 的循环。
当前 P0 边界¶
P0 只做轻量可验证版本:
- Evidence 用
vault/10-raw/、inbox、Evidence Registry、source uri 和 hash 记录。 - Ontology 用
domain-topology.json、ontology registry、project status、experiment registry、ADR 和 task skill manifest 表达。 - Runtime Projection 用本地 Context Router、SearchConnector、Tool Gateway、Ask Router、Knowledge Card 和 No-WeCom Demo 验证。
暂不做完整图数据库、完整 MVC 权限系统、真实企业微信 adapter 和真实外部业务系统写回。这些是后续把当前 MVP 产品化时的扩展点。