技术路线外部调研与方案修正¶

为什么做这轮调研¶

前一轮实验已经验证了入库阶段不能过早摘要化。但这些实验仍然默认了既有技术路线：ES / embedding / MCP / Zenoh / 企微入口。

为了避免在既定路线里自证，本轮并行调研了企业 RAG、开源知识库、检索引擎、GraphRAG、MCP 工具层和总线/编排方案。结论是：当前主线不用推倒，但需要做关键修正。

OrgReOrg / Harness 的核心不应被 Dify、RAGFlow、Open WebUI 或 AnythingLLM 整体替代。它们更适合被拆成可借鉴模块：

需要立刻修正的地方：

检索底座不能只验证 ES / OpenSearch，也要纳入 Postgres + pgvector / FTS。
MCP 不作为安全边界，必须经过 Tool Gateway。
Zenoh 暂时不进入核心 Demo 主线，先用 registry + HTTP/gRPC，必要时再评估 NATS、Kafka / Redpanda 或 Zenoh。

后续 agentic_search_option_benchmark 已进一步修正检索底座优先级：P0 默认采用 Markdown 渐进披露 + Postgres FTS/pgvector；OpenSearch/ES 保留为规模化 adapter；纯向量库不作为核心默认方案。

路线	适合什么	当前判断
OpenSearch / Elasticsearch	BM25、hybrid、RRF、rerank、explain、索引生命周期、权限过滤	规模化 adapter 候选，不作为 P0 默认主线
Postgres + pgvector / FTS	小中规模、强一致、低运维、RLS、业务数据同库	P0 D3 检索投影默认候选，必须进入真实 adapter benchmark
Qdrant / Weaviate	快速向量和混合检索原型	可作为第二批对照
Vespa	大规模、复杂排序、在线特征、强 ranking expression	当前过重，除非排序逻辑明显复杂
GraphRAG / LightRAG	多跳、全局总结、跨文档关系	只作为增强层，不替代基础检索

下一轮实验从 retrieval_failure_benchmark 升级为：

retrieval_platform_benchmark

同一批文档、同一批查询、同一批权限和 stale data 反例，同时跑：

指标包括 Recall@20 / 50、nDCG@10、MRR、P50 / P95 / P99、update/delete 可见延迟、权限泄漏数和资源成本。

MCP 只解决工具接入协议，不解决安全。第一阶段应新增 Tool Gateway：

Agent Orchestrator
  -> Tool Gateway
  -> Tool Registry
  -> MCP / HTTP / internal function tools
  -> Audit Log

Tool Gateway 至少负责：

原先把 Zenoh 放在 capability registry / queryable 的较前位置。现在修正为：

阶段	选择	原因
Demo	JSON / Postgres registry + HTTP/gRPC	低复杂度、易调试、权限可落表
内部服务发现	NATS	更贴近服务发现、request/reply 和 subject 权限
审计事件流	Kafka / Redpanda	适合不可变事件、长期留痕和回放
长流程恢复	Temporal / LangGraph	适合人审、长任务、失败恢复和 checkpoint
弱网络 / 边缘 / 多机房	Zenoh spike	出现真实需求后再接入

Zenoh 的 pub/sub/query/location transparency 思想仍然有价值，但当前 Demo 最大风险在检索质量、权限过滤、工具治理和长流程恢复。过早引入 Zenoh 会增加调试和运维复杂度。

agentic_search_option_benchmark：已完成第一轮，确定 P0 用 Markdown + Postgres FTS/pgvector，规模化保留 OpenSearch/ES。
retrieval_platform_benchmark：把同一反例集接到 Postgres FTS/pgvector 与 OpenSearch/ES adapter。
tool_gateway_safety_harness：MCP 工具描述注入、输出注入、SSRF、越权 scope 和写操作审批。
document_parser_spike：RAGFlow / Docling / MinerU 处理 PDF、表格、扫描件，验证复杂文档入库质量。
external_knowledge_api_adapter：设计兼容 Dify External Knowledge API 的 /retrieval 接口。
graph_rag_spike：只在多跳、全局总结和跨文档关系问题上测试 GraphRAG / LightRAG。