当前位置: 首页 > news >正文

RAG常见问题

RAG常见问题

RAG流程

  准备:文档 -> chunks -> 向量数据库 

  回答:问题embedding -> 召回 -> 重排

 

常见问题

1、文档的读取

  文档的格式可能是pdf...

2、chunks

  如何合理的分割成不同的chunks

3、embedding

  如何把文档合理的做embedding?

  很多的embedding技术

4、向量数据库

  得到每个chunks的向量后,使用什么样的向量数据库

5、问题

  问题很可能是需要再处理的,大概率是要对问题做扩充/改写