当前位置: 首页 > news >正文

pgvector:PostgreSQL 原生向量搜索扩展

文章目录

  • pgvector:PostgreSQL 原生向量搜索扩展
    • 1、这玩意儿是干嘛的
    • 2、为什么要用它
    • 3、怎么安装使用
    • 4、适合哪些场景

pgvector:PostgreSQL 原生向量搜索扩展

pgvector 在 GitHub 上已经拿到 21.2K Star 了。

这个开源工具专门给 PostgreSQL 加了向量相似性搜索能力,向量可以跟业务数据存在同一个库,不需要额外搭向量数据库。

1、这玩意儿是干嘛的

就是在 PostgreSQL 里加向量存储和搜索的能力,不需要单独部署额外的数据库组件。

支持精确和近似最近邻搜索,覆盖单精度、半精度、二进制、稀疏四种向量类型,内置L2距离、内积、余弦距离、L1距离、汉明距离、Jaccard距离六种算法。

所有带PostgreSQL客户端的语言都能直接用,还继承PostgreSQL本身的ACID合规、时间点恢复、联表查询等所有特性。向量规模大的场景可以用量化功能做水平扩展。

2、为什么要用它

做过RAG或者向量检索的人都知道,单独搭向量数据库的麻烦:业务数据存在关系库,向量存在向量库,两边要做数据同步,一致性很难保证,查询的时候还要跨库做关联,性能损耗大。

pgvector把向量存储和检索直接集成在PostgreSQL里,向量跟业务表存在同一个库,不需要做数据同步,支持直接跟业务表做联表查询,不用额外维护一套数据库组件,运维成本低很多。

支持HNSW和IVFFlat两种近似索引,内存占用可控,查询性能满足绝大多数生产场景需求。

3、怎么安装使用

Linux和Mac环境直接编译安装:

cd/tmpgitclone--branchv0.8.2 https://github.com/pgvector/pgvector.gitcdpgvectormakemakeinstall

也可以用Docker、Homebrew、APT、Yum等方式一键安装,Windows环境可以用nmake编译或者Docker部署。

启用扩展:

CREATEEXTENSION vector;

建表存向量:

CREATETABLEitems(id bigserialPRIMARYKEY,embedding vector(3));

插入向量:

INSERTINTOitems(embedding)VALUES('[1,2,3]'),('[4,5,6]');

查询最近邻:

SELECT*FROMitemsORDERBYembedding<->'[3,1,2]'LIMIT5;

4、适合哪些场景

  • 做RAG系统、需要存向量同时关联业务数据的开发者
  • 不想单独维护向量数据库、希望降低架构复杂度的团队
  • 已经在用PostgreSQL、需要加向量检索能力的业务场景

开源地址:https://github.com/pgvector/pgvector

L、需要加向量检索能力的业务场景

开源地址:https://github.com/pgvector/pgvector

http://www.jsqmd.com/news/810071/

相关文章:

  • Hermes Agent 核心架构分析
  • 2026国内甲醛检测机构推荐及服务解析 - 品牌排行榜
  • Adobe-GenP 3.0:三步解锁Adobe全系列创意软件的终极指南
  • 3分钟快速上手:AMD Ryzen调试神器SMUDebugTool完整使用指南
  • 2026年6大主流CRM厂商深度评测:功能与性价比解析 - Blue_dou
  • 2026风口风阀厂家推荐:技术与应用场景解析 - 品牌排行榜
  • 从AstrBot到Nebula:深度定制聊天机器人框架的架构演进与实践
  • 【invt】【威纶通触摸屏】深圳英威腾CHH100高压变频器监控系统V3.12触摸屏密码
  • 一站式自动化工具OpenCLI,收获19.3k Star
  • 如何深度掌控AMD锐龙性能:Ryzen SDT调试工具终极指南
  • 解决 Claude Code 访问不稳定与 Token 不足的 Taotoken 替代方案
  • 为Claude Code配置Taotoken密钥解决封号与Token不足困扰
  • Python新闻追踪器:基于网络爬虫与关键词过滤的个性化信息聚合工具
  • 1000元加油充值卡回收价格明细,新手不担心吃亏 - 淘淘收小程序
  • 2026石英传感器十大品牌出炉,广州晶石石英传感器凭硬实力上榜 - 品牌速递
  • 2026高温高压设备集成有资质公司推荐:行业实力厂商盘点 - 品牌2025
  • Dify-WebUI:低代码构建AI应用的Web界面实战指南
  • PCIe ATS实战:从协议原理到性能优化与安全考量
  • 供应链韧性构建:从需求预测到库存策略的黑五大促实战指南
  • 390万买台“高达”开上路?王兴兴这次真的坐进去了!
  • ESP8266+STM32远程控制实战:如何通过华为云中转指令与数据
  • 2026年深圳纯直营驾培避坑指南:从C1/C2快速拿证到智驾陪驾一站式闭环 - 企业名录优选推荐
  • Python导入的‘隐形’陷阱:除了循环导入,这些`import`写法也在悄悄拖慢你的项目
  • 值得信赖的选择!广州晶石石英传感器,服务全国超千家企业 - 品牌速递
  • 多模态大语言模型(MLLM)核心架构、关键技术路径与实战指南
  • 2026七类CRM硬核横评:全链路业务协同与数据智能解析 - Blue_dou
  • 本地项目从0到1(AI协作实操指南)
  • 2026年西藏镀锌角钢、工字钢采购指南:源头直供降本秘诀 - 年度推荐企业名录
  • Cortex-R52中断控制器架构与虚拟化技术解析
  • AI时代,我们到底在焦虑什么