当前位置: 首页 > news >正文

85_Spring AI 干货笔记之 Apache Cassandra 向量存储

一、Apache Cassandra 向量存储

本节将引导您设置 CassandraVectorStore 以存储文档嵌入并执行相似性搜索。

二、什么是 Apache Cassandra?

Apache Cassandra® 是一个真正的开源分布式数据库,以其线性可扩展性、经过验证的容错性和低延迟而闻名,使其成为关键任务事务数据的完美平台。

其向量相似性搜索(VSS)基于 JVector 库,确保了一流的性能和相关性。

在 Apache Cassandra 中进行向量搜索就像这样简单:

SELECTcontentFROMtableORDERBYcontent_vector ANNOFquery_embedding;

更多相关文档可以在这里 阅读。

此 Spring AI 向量存储设计用于全新的 RAG 应用程序,并且能够基于现有数据和表进行改造。

该存储还可用于现有数据库中的非 RAG 用例,例如语义搜索、地理邻近搜索等。

存储将根据其配置自动创建或增强所需的模式。如果您不希望修改模式,请使用 initializeSchema 配置存储。

使用 spring-boot-autoconfigure 时,根据 Spring Boot 标准,initializeSchema 默认为 false,您必须通过在 application.properties 文件中设置 …​initialize-schema=true 来选择加入模式创建/修改。

三、什么是 JVector?

JVector 是一个纯 Java 嵌入式向量搜索引擎。

与其他 HNSW 向量相似性搜索实现相比,它之所以脱颖而出,是因为:

  • 算法快速:JVector 使用受 DiskANN 和相关研究启发的最先进图算法,提供高召回率和低延迟。

  • 实现快速:JVector 使用 Panama SIMD API 来加速索引构建和查询。

  • 内存高效:JVector 使用产品量化压缩向量,以便在搜索期间它们可以保留在内存中。

  • 磁盘感知:JVector 的磁盘布局设计为在查询时进行最少必要的 IOPS。

  • 并发:索引构建至少可线性扩展到 32 个线程。线程数加倍,构建时间减半。

  • 增量:在构建索引的同时查询索引。在添加向量和能够在搜索结果中找到它之间没有延迟。

  • 易于嵌入:API 设计易于嵌入,由在生产中使用它的人设计。

四、先决条件

一个 EmbeddingModel实例 来计算文档嵌入。这通常配置为 Spring Bean。有几种选择:

  • Transformers 嵌入- 在您的本地环境中计算嵌入。默认是通过 ONNX 和 all-MiniLM-L6-v2 句子转换器。这可以直接使用。

  • 如果您想使用 OpenAI 的嵌入- 使用 OpenAI 嵌入端点。您需要在 OpenAI 注册 创建账户,并在 API 密钥 生成 api-key 令牌。

  • 还有许多其他选择,请参阅嵌入 API 文档。

一个 Apache Cassandra 实例,版本为 5.0-beta1 或更高

  • DIY 快速入门

  • 对于托管服务,Astra DB 提供了一个相当不错的免费层级服务。

五、依赖项

Spring AI 自动配置、启动器模块的工件名称发生了重大变化。请参阅升级说明以获取更多信息。

对于 依赖管理,我们建议使用 Spring AI BOM,如依赖管理部分所述。

将这些依赖项添加到您的项目中:

  • 仅用于 Cassandra 向量存储:
<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-cassandra-store</artifactId></dependency>

或者,用于 RAG 应用程序中所需的一切(使用默认的 ONNX 嵌入模型):

<dependency><groupId>org.springframework.ai</groupId><artifactId>spring-ai-starter-vector-store-cassandra</artifactId></dependency>

六、配置属性

您可以在 Spring Boot 配置中使用以下属性来自定义 Apache Cassandra 向量存储。

七、使用

7.1 基本用法

创建一个 CassandraVectorStore 实例作为 Spring Bean:

@BeanpublicVectorStorevectorStore(CqlSessionsession,EmbeddingModelembeddingModel){returnCassandraVectorStore.builder(embeddingModel).session(session).keyspace("my_keyspace").table("my_vectors").build();}

一旦有了向量存储实例,您就可以添加文档并执行搜索:

// 添加文档vectorStore.add(List.of(newDocument("1","内容1",Map.
http://www.jsqmd.com/news/343037/

相关文章:

  • 2026年2月中国境外券商投行机构推荐:看这5家公司就对了 - Top品牌推荐
  • 深入解析:【MySQL】数据库备份与恢复
  • 苹果 iPhone 14 Pro Max 高质量深度解析|配色外观|核心参数|屏幕与影像|续航充电|官方维修手册|二手验机清单
  • 【毕业设计】基于python+Hadoop的国家气象降雨量大数据分析系统(源码+文档+远程调试,全bao定制等)
  • 苹果 iPhone 15 高质量介绍:参数解析|体验要点|验机清单|维修手册重点
  • ubuntu卸载包
  • 程序员如何从 0 到 1 自己开发一个 AI Agent?
  • 03. PyTorch的使用
  • day76(2.4)——leetcode面试经典150
  • 一个 SpringBoot 项目能处理多少请求?我终于悟了
  • 企业级 Agent 在 K8s 上的运行模型
  • 【计算机毕业设计案例】基于python+Hadoop的国家气象降雨量大数据分析系统基于hadoop的气象数据分析与可视化系统(程序+文档+讲解+定制)
  • SpringCloud从入门到上天:Nacos做微服务注册中心
  • 来自 Nimbus-7 SMMR 和 DMSP SSM/I-SSMIS 被动微波数据的海冰浓度 V002
  • 高校物业维修管理微信小程序的设计和实现
  • MySQL 5.7 转 Oracle 实习生核心注意事项(企业常见场景)
  • D.二分查找-二分答案-求最小——1870. 准时到达的列车最小时速
  • 从入门到精通:Boris Cherny 亲测的 Claude Code 十大高级技巧 + 插件实操(万字详解)
  • 大数据毕设项目推荐-基于hadoop的气象数据分析与可视化系统基于python+Hadoop的国家气象降雨量大数据分析系统【附源码+文档,调试定制服务】
  • axios和jsdom的碰撞
  • 计算机大数据毕设实战-基于python+Hadoop的国家气象降雨量大数据分析系统气象数据可视化平台【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • 8-4 WPS JS宏 new RegExp()、test()、exec()正则表达式的创建与使用
  • 【课程设计/毕业设计】基于大数据的多维度气象数据的可视化分析系统基于python+Hadoop的国家气象降雨量大数据分析系统【附源码、数据库、万字文档】
  • 基于STM32F103驱动QMI8658A输出加速度陀螺仪数据
  • JVM面试必背专题(2026最新版):从基础到高版本,一文吃透所有核心考点
  • 【无人机协同路径规划】基于六种最新优化算法(CCO、TOC、MSO、DOA、GOA、OX)求解多个无人机协同路径规划,可以自定义无人机数量及起始点附Matlab代码
  • 【课程设计/毕业设计】基于Hadoop的某篮球队各个球员数据分析数据可视化系统实现【附源码、数据库、万字文档】
  • 【开题答辩全过程】以 工业车辆维修APP设计与实现为例,包含答辩的问题和答案
  • 数据库全解析:从关系型到向量数据库,LLM 开发中的选型指南
  • 计算机毕业设计springboot任我听——音乐推荐系统的开发 基于 SpringBoot 的 “随心听” 个性化音乐推荐平台开发 SpringBoot 框架下智能音乐推荐系统 “乐伴听” 的设计