当前位置：首页 > news >正文

Ollama+EmbeddingGemma-300m：快速构建智能文档检索系统

news 2026/6/11 7:01:38

Ollama+EmbeddingGemma-300m：快速构建智能文档检索系统

想不想在本地电脑上搭建一个能理解语义的文档检索系统？不用依赖云端API，不用担心数据隐私，还能处理各种格式的文档？今天我们就来聊聊如何用Ollama部署EmbeddingGemma-300m模型，快速构建一个智能文档检索系统。

EmbeddingGemma-300m是谷歌推出的开源嵌入模型，虽然只有3亿参数，但基于先进的Gemma 3架构，能够将文本转换成高质量的向量表示。这些向量就像是文本的"数字指纹"，可以用来做语义搜索、文档分类和智能推荐。最棒的是，它足够轻量，能在普通笔记本电脑上流畅运行。

1. 环境准备与模型部署

1.1 安装Ollama

Ollama是一个强大的工具，能让你像下载应用一样在本地运行各种大语言模型。根据你的操作系统选择安装方式：

Windows/macOS用户：直接下载安装程序，双击运行即可
Linux用户：可以通过一行命令快速安装：

curl -fsSL https://ollama.com/install.sh | sh

安装完成后，打开终端输入以下命令验证是否安装成功：

ollama --version

1.2 拉取并运行EmbeddingGemma-300m模型

使用Ollama拉取模型非常简单，只需执行以下命令：

ollama pull embeddinggemma:300m

下载完成后，启动模型服务：

ollama run embeddinggemma:300m

看到模型成功加载后，你可以尝试输入一段文字，它会返回一个向量表示。不过命令行交互效率不高，我们需要一个更友好的界面。

2. 构建文档检索系统

2.1 文档处理流程

一个完整的智能文档检索系统通常包含以下几个步骤：

文档加载：支持各种格式的文档（PDF、Word、TXT等）
文本分割：将长文档分割成适合处理的片段
向量化：使用EmbeddingGemma生成文本向量
存储：将向量存入向量数据库
检索：根据查询返回最相关的文档

2.2 使用LangChain构建系统

我们可以使用LangChain框架来简化这个流程。首先安装必要的Python包：

pip install langchain langchain-community chromadb pypdf

然后创建一个简单的检索系统：

from langchain_community.document_loaders import PyPDFLoader from langchain_text_splitters import RecursiveCharacterTextSplitter from langchain_community.embeddings import OllamaEmbeddings from langchain_community.vectorstores import Chroma # 加载PDF文档 loader = PyPDFLoader("example.pdf") pages = loader.load() # 分割文本 text_splitter = RecursiveCharacterTextSplitter( chunk_size=1000, chunk_overlap=200 ) splits = text_splitter.split_documents(pages) # 初始化EmbeddingGemma嵌入模型 embeddings = OllamaEmbeddings(model="embeddinggemma:300m") # 创建向量数据库 vectorstore = Chroma.from_documents( documents=splits, embedding=embeddings, persist_directory="./chroma_db" ) # 检索文档 query = "人工智能的最新发展" docs = vectorstore.similarity_search(query) print(docs[0].page_content)

3. 批量处理文档

3.1 支持多种文档格式

在实际应用中，我们通常需要处理各种格式的文档。LangChain提供了多种文档加载器：

# Word文档 from langchain_community.document_loaders import Docx2txtLoader loader = Docx2txtLoader("example.docx") # 纯文本 from langchain_community.document_loaders import TextLoader loader = TextLoader("example.txt") # 网页内容 from langchain_community.document_loaders import WebBaseLoader loader = WebBaseLoader("https://example.com")

3.2 批量处理文件夹

对于大量文档，我们可以批量处理整个文件夹：

from langchain_community.document_loaders import DirectoryLoader loader = DirectoryLoader( "./docs", glob="**/*.pdf", loader_cls=PyPDFLoader ) documents = loader.load()