当前位置：首页 > news >正文

85_Spring AI 干货笔记之 Apache Cassandra 向量存储

news 2026/7/12 8:39:50

一、Apache Cassandra 向量存储

本节将引导您设置 CassandraVectorStore 以存储文档嵌入并执行相似性搜索。

二、什么是 Apache Cassandra？

Apache Cassandra® 是一个真正的开源分布式数据库，以其线性可扩展性、经过验证的容错性和低延迟而闻名，使其成为关键任务事务数据的完美平台。

其向量相似性搜索（VSS）基于 JVector 库，确保了一流的性能和相关性。

在 Apache Cassandra 中进行向量搜索就像这样简单：

SELECTcontentFROMtableORDERBYcontent_vector ANNOFquery_embedding;

更多相关文档可以在这里阅读。

此 Spring AI 向量存储设计用于全新的 RAG 应用程序，并且能够基于现有数据和表进行改造。

该存储还可用于现有数据库中的非 RAG 用例，例如语义搜索、地理邻近搜索等。

存储将根据其配置自动创建或增强所需的模式。如果您不希望修改模式，请使用 initializeSchema 配置存储。

使用 spring-boot-autoconfigure 时，根据 Spring Boot 标准，initializeSchema 默认为 false，您必须通过在 application.properties 文件中设置 …initialize-schema=true 来选择加入模式创建/修改。

三、什么是 JVector？

JVector 是一个纯 Java 嵌入式向量搜索引擎。

与其他 HNSW 向量相似性搜索实现相比，它之所以脱颖而出，是因为：

算法快速：JVector 使用受 DiskANN 和相关研究启发的最先进图算法，提供高召回率和低延迟。
实现快速：JVector 使用 Panama SIMD API 来加速索引构建和查询。
内存高效：JVector 使用产品量化压缩向量，以便在搜索期间它们可以保留在内存中。
磁盘感知：JVector 的磁盘布局设计为在查询时进行最少必要的 IOPS。
并发：索引构建至少可线性扩展到 32 个线程。线程数加倍，构建时间减半。
增量：在构建索引的同时查询索引。在添加向量和能够在搜索结果中找到它之间没有延迟。
易于嵌入：API 设计易于嵌入，由在生产中使用它的人设计。

四、先决条件

一个 EmbeddingModel实例来计算文档嵌入。这通常配置为 Spring Bean。有几种选择：

Transformers 嵌入- 在您的本地环境中计算嵌入。默认是通过 ONNX 和 all-MiniLM-L6-v2 句子转换器。这可以直接使用。
如果您想使用 OpenAI 的嵌入- 使用 OpenAI 嵌入端点。您需要在 OpenAI 注册创建账户，并在 API 密钥生成 api-key 令牌。
还有许多其他选择，请参阅嵌入 API 文档。

一个 Apache Cassandra 实例，版本为 5.0-beta1 或更高

DIY 快速入门
对于托管服务，Astra DB 提供了一个相当不错的免费层级服务。

五、依赖项

Spring AI 自动配置、启动器模块的工件名称发生了重大变化。请参阅升级说明以获取更多信息。

对于依赖管理，我们建议使用 Spring AI BOM，如依赖管理部分所述。

将这些依赖项添加到您的项目中：

仅用于 Cassandra 向量存储：

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-cassandra-store</artifactId></dependency>

或者，用于 RAG 应用程序中所需的一切（使用默认的 ONNX 嵌入模型）：

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-starter-vector-store-cassandra</artifactId></dependency>

六、配置属性

您可以在 Spring Boot 配置中使用以下属性来自定义 Apache Cassandra 向量存储。

七、使用

7.1 基本用法

创建一个 CassandraVectorStore 实例作为 Spring Bean：

@BeanpublicVectorStorevectorStore(CqlSessionsession,EmbeddingModelembeddingModel){returnCassandraVectorStore.builder(embeddingModel).session(session).keyspace("my_keyspace").table("my_vectors").build();}

一旦有了向量存储实例，您就可以添加文档并执行搜索：

// 添加文档vectorStore.add(List.of(newDocument("1","内容1",Map.

查看全文

http://www.jsqmd.com/news/343037/

2026年2月中国境外券商投行机构推荐：看这5家公司就对了 - Top品牌推荐

深入解析：【MySQL】数据库备份与恢复

苹果 iPhone 14 Pro Max 高质量深度解析｜配色外观｜核心参数｜屏幕与影像｜续航充电｜官方维修手册｜二手验机清单

【毕业设计】基于python+Hadoop的国家气象降雨量大数据分析系统(源码+文档+远程调试，全bao定制等)

苹果 iPhone 15 高质量介绍：参数解析｜体验要点｜验机清单｜维修手册重点

ubuntu卸载包

程序员如何从 0 到 1 自己开发一个 AI Agent？

03. PyTorch的使用

day76（2.4）——leetcode面试经典150

一个 SpringBoot 项目能处理多少请求？我终于悟了

企业级 Agent 在 K8s 上的运行模型

【计算机毕业设计案例】基于python+Hadoop的国家气象降雨量大数据分析系统基于hadoop的气象数据分析与可视化系统(程序+文档+讲解+定制)

SpringCloud从入门到上天：Nacos做微服务注册中心

来自 Nimbus-7 SMMR 和 DMSP SSM/I-SSMIS 被动微波数据的海冰浓度 V002

高校物业维修管理微信小程序的设计和实现

MySQL 5.7 转 Oracle 实习生核心注意事项（企业常见场景）

D.二分查找－二分答案－求最小——1870. 准时到达的列车最小时速

从入门到精通：Boris Cherny 亲测的 Claude Code 十大高级技巧 + 插件实操（万字详解）

axios和jsdom的碰撞

计算机大数据毕设实战-基于python+Hadoop的国家气象降雨量大数据分析系统气象数据可视化平台【完整源码+LW+部署说明+演示视频，全bao一条龙等】

8-4 WPS JS宏 new RegExp()、test()、exec()正则表达式的创建与使用

【课程设计/毕业设计】基于大数据的多维度气象数据的可视化分析系统基于python+Hadoop的国家气象降雨量大数据分析系统【附源码、数据库、万字文档】

基于STM32F103驱动QMI8658A输出加速度陀螺仪数据

JVM面试必背专题（2026最新版）：从基础到高版本，一文吃透所有核心考点

【课程设计/毕业设计】基于Hadoop的某篮球队各个球员数据分析数据可视化系统实现【附源码、数据库、万字文档】

【开题答辩全过程】以工业车辆维修APP设计与实现为例，包含答辩的问题和答案

数据库全解析：从关系型到向量数据库，LLM 开发中的选型指南

计算机毕业设计springboot任我听——音乐推荐系统的开发基于 SpringBoot 的 “随心听” 个性化音乐推荐平台开发 SpringBoot 框架下智能音乐推荐系统 “乐伴听” 的设计