Resource Hub

创建于2026年02月27日 14:10

状态

公开

在实际的工业级 RAG（检索增强生成）或搜索系统中，这些方案既可以独立使用，也可以组合使用。它们并不是互斥的，而是针对不同维度的优化。

通常的演进路径是：先做切片（基础） $\rightarrow$ 加入混合检索（提升准确率） $\rightarrow$ 引入多向量/重排序（精细化）。

状态：必须做。 无论你采用后续哪种高级方案，切片是所有向量化操作的前提。

原因： 模型（如 BGE-M3）有最大 Token 限制（通常是 512 或 8192）。如果你强行把几万字塞进去，模型会丢失后半部分信息，或者导致语义稀释严重。
做法： 按照语义（段落、标题）或固定长度（如 300-500 字）切分。

状态：强烈建议组合使用。 这是目前最主流的方案。你不需要在“向量”和“关键词”之间二选一，而是同时计算两者的分数。

状态：独立于 Dense 方案，通常作为“精排”使用。

状态：可选，视场景而定。

独立性： 它通常作为“额外索引”存在。
场景： 比如你有一本书，切片后有 1000 个块。你可以给整本书做一个摘要向量。用户搜“这本书讲了什么”时，匹配摘要向量；搜“某个具体实验步骤”时，匹配切片向量。

如果你现在才开始尝试：