当前位置: 首页 > news >正文

Semantic Kernel使用连接器进行向量搜索

目录

向量搜索(Vector Search)

支持的向量类型

向量搜索选项

VectorProperty

Top 和 Skip

IncludeVectors

Filter

小结


Semantic Kernel 提供了向量存储(Vector Store)抽象层中的向量搜索功能,支持多种选项如过滤、分页等。本文将详细介绍其用法。

向量搜索(Vector Search)

SearchAsync方法允许基于已向量化的数据进行搜索。该方法接收一个向量和可选的VectorSearchOptions<TRecord>作为输入,适用于以下类型:

  • IVectorSearchable<TRecord>

  • VectorStoreCollection<TKey, TRecord>

注意VectorStoreCollection<TKey, TRecord>实现了IVectorSearchable<TRecord>

如下是VectorStoreCollection类的定义:

public abstract class VectorStoreCollection<TKey, TRecord> : IVectorSearchable<TRecord>, IDisposable where TKey : notnull where TRecord : class { ..... }

支持的向量类型

SearchAsync的向量参数为泛型类型。每个数据存储支持的向量类型不同,请参阅各连接器文档。

⚠️ 搜索向量类型必须与目标向量类型一致。例如,同一条记录中有两个不同类型的向量,需确保提供的搜索向量与目标向量类型匹配。若有多个向量,可通过VectorProperty指定目标。


向量搜索选项

通过VectorSearchOptions<TRecord>可配置以下选项:

VectorProperty

指定要搜索的向量属性。如果未指定且模型仅包含一个向量,则使用该向量。若没有或有多个向量而未指定,则会抛出异常。

public async IAsyncEnumerable<(Hotel Record, double? Score)> SearchByTextAsync( string query, int topK = 5, CancellationToken ct = default) { var queryVector = await _emb.CreateAsync(query, ct); var col = GetCollection(); var options = new VectorSearchOptions<Hotel> { //Filter = h => h.HotelName == "Tokyo", VectorProperty = h => h.DescriptionEmbedding, Skip = 0, IncludeVectors = false }; awaitforeach (var r in col.SearchAsync(queryVector, topK, options, ct)) { yield return (r.Record, r.Score); } }

Top 和 Skip

用于分页。

  • Top:返回前 N 条结果

  • Skip:跳过前 N 条结果

var vectorSearchOptions = new VectorSearchOptions<Product> { Skip = 40 }; var searchResult = collection.SearchAsync(searchVector, top: 20, vectorSearchOptions);

IncludeVectors

指定是否返回结果中的向量属性。

  • 默认值:false(节省带宽与处理成本)

  • 若为true,则返回完整向量数据

var vectorSearchOptions = new VectorSearchOptions<Product> { IncludeVectors = true };

Filter

用于在向量搜索前先对记录进行过滤。

好处:

  • 降低延迟和计算开销

  • 用于访问控制,过滤掉用户无权限的数据

⚠️ 很多存储需要字段设置为IsIndexed = true才能参与过滤。

public async IAsyncEnumerable<(Hotel Record, double? Score)> SearchByTextAsync( string query, int topK = 5, CancellationToken ct = default) { var queryVector = await _emb.CreateAsync(query, ct); var col = GetCollection(); var options = new VectorSearchOptions<Hotel> { Filter = h => h.HotelName == "Tokyo", VectorProperty = h => h.DescriptionEmbedding, Skip = 0, IncludeVectors = false }; awaitforeach (var r in col.SearchAsync(queryVector, topK, options, ct)) { yield return (r.Record, r.Score); } }

小结

Semantic Kernel 的 Vector Store 连接器提供了强大的向量搜索功能:

  • SearchAsync:执行相似度搜索

  • VectorProperty:选择目标向量

  • Top / Skip:支持分页

  • IncludeVectors:是否返回向量

  • Filter:先过滤后搜索,提高性能和安全性

这些功能让你能够在不同存储(如 InMemory、Qdrant 等)上轻松实现向量化搜索和检索。

引入地址

http://www.jsqmd.com/news/120280/

相关文章:

  • Vue.js + Element UI 实战:企业级后台管理系统开发全流程
  • 2025年家长必看!儿童鞋服品牌排行榜前十名权威盘点,这些品牌凭什么征服千万家庭? - 品牌测评鉴赏家
  • 跨境电子商务综合试验区DID(内含七批试验区名单)
  • 0-16岁儿童鞋服品牌全解析:从高端到平价,总有一款适合你家宝贝 - 品牌测评鉴赏家
  • 【漏水定位】基于压力测量和拓扑信息实现的稳健数据驱动漏水定位附Matlab代码
  • 1991-2025年地市级年度科学家数量统计数据
  • 一个基于 .NET MAUI 的开箱即用的 UI 组件库,可快速搭建面向业务的应用程序界面!
  • ESA正式授予Sivers波束成形技术开发合同
  • 2025儿童鞋服品牌Top10揭晓!这些品牌凭什么征服家长? - 品牌测评鉴赏家
  • Ubuntu下Qt应用崩溃自动重启6大方案
  • Java毕设选题推荐:基于springboot的游泳用品专卖店系统的设计与实现泳衣、泳镜、浮板【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 事后诸葛亮分析
  • 宝妈必看!2025高性价比儿童鞋服品牌红榜,安全舒适还省钱 - 品牌测评鉴赏家
  • Java毕设项目推荐-基于Springboot的乡政府管理系统设计与实现基于springboot的村务管理系统的设计与实现【附源码+文档,调试定制服务】
  • 2025年12月男生女生童装鞋子质量评测报告 - 品牌测评鉴赏家
  • 第2章:LangChain大模型工具开发(Agent工具能力)
  • win键盘设置改为类似mac 配置
  • 第196期 TRAE 与 Amazon Kiro 智能体驱动集成开发环境(Agentic IDE)对比 - 详解
  • 基于SpringBoot的智能家居控制系统的设计与实现
  • 再见,Kimi?月活不及豆包 5%,谁是下一个王?
  • SoundFlow 开源 .NET 音频引擎
  • 【课程设计/毕业设计】基于springboot的游泳用品专卖店系统的设计与实现商品入库登记、出库审核、库存预警【附源码、数据库、万字文档】
  • 2025年12月男生女生童装品牌深度解析:加盟优势与市场前景 - 品牌测评鉴赏家
  • 【计算机毕业设计案例】基于Spring Boot的数字乡村治理系统“村事通”设计与实现基于springboot的村务管理系统的设计与实现(程序+文档+讲解+定制)
  • 单向循环链表
  • 宝妈必收藏!高性价比儿童鞋服品牌清单,省钱又省心 - 品牌测评鉴赏家
  • Github项目CICD部署
  • 2025年12月中国童装品牌深度调研:男生女生童装舒适度与性价比分析报告 - 品牌测评鉴赏家
  • 【机械】螺旋千斤顶的标准机械分析Matlab实现
  • mengzhu铃声