标签: 向量检索

3 个内容

笔记(3)

RRF(倒数排名融合)是混合检索黄金准则,无需权重调优合并BM25与向量余弦分值。核心公式:Score(d)=∑1/(k+r(d)),k=60平滑排名。优势:抹平分值差异、奖励双优文档。落地:每源取前50-100结果融合,后接Re-ranker。

Elliot Yang·
35 浏览

文章介绍工业级RAG/搜索系统优化方案:**背景**为向量化Token限制与检索准确性问题。**关键技术**包括切片(基础,必备)、混合检索(Dense+Sparse+RRF,提升准确率)、多向量/ColBERT(精排,占资源)、摘要向量化(辅助)。**推荐路径**:切片→混合检索→重排序,实现粗排+精排全流程。(148字符)

Elliot Yang·
65 浏览

Dify的RAG优化面临检索质量和生成结果相关性挑战。优化需关注:embedding模型和向量数据库选型、混合检索和重排序、知识库预处理(chunking、元数据增强)、query扩展、prompt工程、上下文压缩等。新兴技术如ColBERT和FLARE,以及幻觉和数据泄露风险需关注。监控和AB测试至关重要。

Elliot Yang·
352 浏览