RAG常见问题
RAG流程
准备:文档 -> chunks -> 向量数据库
回答:问题embedding -> 召回 -> 重排
常见问题
1、文档的读取
文档的格式可能是pdf...
2、chunks
如何合理的分割成不同的chunks
3、embedding
如何把文档合理的做embedding?
很多的embedding技术
4、向量数据库
得到每个chunks的向量后,使用什么样的向量数据库
5、问题
问题很可能是需要再处理的,大概率是要对问题做扩充/改写
准备:文档 -> chunks -> 向量数据库
回答:问题embedding -> 召回 -> 重排
1、文档的读取
文档的格式可能是pdf...
2、chunks
如何合理的分割成不同的chunks
3、embedding
如何把文档合理的做embedding?
很多的embedding技术
4、向量数据库
得到每个chunks的向量后,使用什么样的向量数据库
5、问题
问题很可能是需要再处理的,大概率是要对问题做扩充/改写