当前位置：首页 > news >正文

[智能体-287]：向量数据库 vs 传统关系型数据库（MySQL）：存储内容 + 常用操作对比

news 2026/7/29 10:15:39

向量数据库 vs 传统关系型数据库（MySQL）：存储内容 + 常用操作对比

一、各自存放内容（核心区分，结合词向量案例）

1. 传统关系型数据库（MySQL/PostgreSQL）：结构化数据

只存标量结构化数据，无高维浮点向量

存储字段类型：数字、字符串、日期、枚举、布尔。

示例数据表：水果信息表

表格

id(int)	name(varchar)	category(varchar)	price(float)	create_time(date)
1	苹果	水果	8.5	2025-01-10
2	香蕉	水果	6.2	2025-01-11
3	轿车	交通工具	99999	2025-02-01

用途：业务属性、原文、编号、价格、分类等业务字段。

2. 向量数据库（Milvus/Qdrant/Chroma）：非结构化数据：向量

两类数据同存：标量字段 + 高维稠密向量字段（词向量 / Embedding）Collection（等价数据表）结构：

表格

id (主键)	name (字符串标量)	category (字符串标量)	vec (向量字段，3 维浮点数组)
1	苹果	水果	[0.61,0.22,-0.55]
2	香蕉	水果	[0.58,0.25,-0.52]
3	轿车	交通工具	[-0.62,0.28,0.35]

标量：分类、名称、标签，用于过滤；
向量：由 Word2Vec/BERT 生成，用于语义相似度搜索。

落地规范：MySQL 存业务详情，向量库只存标签 + 向量 + 唯一 ID。

二、核心操作对比：增、删、改、查（重中之重）

1、新增数据

MySQL：INSERT，整行结构化写入

sql

INSERT INTO fruit(id,name,category,price) VALUES(1,'苹果','水果',8.5);

特点：字段固定约束、类型校验、支持事务。

向量库：add/insert，同时写入标量 + 向量数组

python

运行

coll.add(ids=["1"],documents=["苹果"],metadatas=[{"category":"水果"}], embeddings=[[0.61,0.22,-0.55]])

特点：向量是浮点数组，无严格范式约束。

2、删除数据

MySQL：按字段条件删除（等值 / 区间）

sql

DELETE FROM fruit WHERE id=1; DELETE FROM fruit WHERE category='水果';

向量库：按 id删 / 按标量过滤批量删

python

运行

coll.delete(ids=["1"]) coll.delete(where={"category":"水果"})

3、修改更新

MySQL：UPDATE，按条件修改任意标量字段

sql

UPDATE fruit SET price=9 WHERE id=1;

向量库：整体覆盖，不能单独修改向量中某一个浮点数，只能整条数据替换向量

python

运行

coll.update(ids=["1"],embeddings=[[0.62,0.23,-0.54]])

4、查询（最本质差距）！！！！

（1）MySQL：精确匹配 / 区间查询，没有语义检索能力

等值查询

sql

SELECT * FROM fruit WHERE name='苹果';

只能查出苹果，查不出香蕉。

范围筛选

sql

SELECT * FROM fruit WHERE price<10 AND category='水果';

只能按字面、数值筛选，不懂词义相似。

（2）向量数据库：两种查询：标量过滤 + 向量相似度检索（ANN）

普通标量过滤（同 MySQL）：筛选 category="水果"
核心：向量相似检索（独有）输入苹果向量[0.61,0.22,-0.55]，查 Top2 相似：

python

运行

res=coll.query(query_embeddings=[[0.61,0.22,-0.55]],n_results=2)

返回：苹果、香蕉（语义相近，文字不一样也能命中）。

3.混合查询（工业常用）：先标量过滤，再向量检索

python

运行

coll.query(query_embeddings=[...],where={"category":"水果"})

先筛水果类目，再在水果里找语义相似内容。

5、额外特有操作

MySQL 独有

JOIN 多表关联、GROUP BY 分组统计、聚合 (sum/count)、外键约束、事务回滚。

向量库独有

构建 HNSW/IVF 向量索引、余弦 / L2 距离计算、向量归一化、批量向量聚类。

三、简明总结

MySQL：存属性，查字面；擅长精确筛选、统计、业务账务。
向量库：存属性 + 词向量，查语义；擅长相似召回、RAG、以文搜文。

查看全文

http://www.jsqmd.com/news/960376/

别再为MATLAB摄像头支持包发愁了！保姆级教程：从注册账号到成功预览画面的完整流程

告别串口线！用STM32HAL库的USB虚拟串口实现printf调试（基于STM32F103CBT6）

Android设备存储空间显示异常？手把手教你修改BoardConfig.mk搞定userdata分区大小

2026年成都水泥制品厂家评测：成都钢筋混凝土电力槽/成都钢筋混凝土盖板/成都水泥制品公司推荐/核心维度对比解析 - 优质品牌商家

含光伏风电的配电网可靠性MATLAB仿真工具包（含9节点案例与潮流计算全套函数）

异常值不是错误，而是业务信号：数据科学中的语义化检测与决策

灰度发布与金丝雀发布

用Docker打包你的量化环境：基于python3.7-slim-stretch与AKShare 0.9.65制作可复现的基础镜像

D Ag？

Hutool NumberUtil不止是计算器：生成随机验证码、判断质数、进制转换这些场景你用过吗？

从一次失败的登录测试说起：手把手教你用Burp Suite给Pikachu靶场‘验证码绕过’漏洞做‘尸检报告’

用STM32的UID生成唯一MAC地址？一个实战项目中的防克隆与联网身份设计

Android 11适配实战：从‘分区存储’到‘软件包可见性’，一个老项目的踩坑与填坑全记录

手把手教你优化RTL8762C/D BLE应用：从功耗测试到内存管理的进阶技巧

PyTorch为何成为TVA的“大脑皮层“（10）

西安东威新能源购车渠道评测：青龙路直营店靠谱性实测 - 优质品牌商家

目标检测Head设计避坑指南：从RetinaNet到DyHead，我踩过的那些注意力机制的‘坑’

蓝绿发布与灰度发布

深圳混凝土柱子切割技术实操推荐：工艺与服务保障 - 优质品牌商家

用Wireshark和Python实战解析PCAP文件：从抓包到自定义解析脚本

国产手机技术演进：从硬件差距到生态创新的工程实践与思考

[智能体-291]：结合 BERT 视角：人类自然语言的本质 —— 表意不在字面，语义依附语境

WRF-Chem实战：如何为你的城市空气质量模拟优化namelist.input参数（以RADM2+MADE/SORGAM为例）

PyTorch为何成为TVA的“大脑皮层“（8）

华硕笔记本终极优化指南：轻量级控制神器G-Helper完全教程

技术管理者如何用刨根问底法有效领导专业团队

避坑指南：从单机HBase升级到伪分布式，HBase 2.1.1配置hbase-site.xml的3个关键点

精选:口碑好的水泥机械轴承厂家 - 品牌推广大师

虚拟游戏控制器驱动深度解析：ViGEmBus的技术架构与实战应用

向量数据库 vs 传统关系型数据库（MySQL）：存储内容 + 常用操作对比

一、各自存放内容（核心区分，结合词向量案例）

1. 传统关系型数据库（MySQL/PostgreSQL）：结构化数据

2. 向量数据库（Milvus/Qdrant/Chroma）：非结构化数据：向量

二、核心操作对比：增、删、改、查（重中之重）

1、新增数据

MySQL：INSERT，整行结构化写入

向量库：add/insert，同时写入标量 + 向量数组

2、删除数据

MySQL：按字段条件删除（等值 / 区间）

向量库：按 id删 / 按标量过滤批量删

3、修改更新

MySQL：UPDATE，按条件修改任意标量字段

向量库：整体覆盖，不能单独修改向量中某一个浮点数，只能整条数据替换向量

4、查询（最本质差距）！！！！

（1）MySQL：精确匹配 / 区间查询，没有语义检索能力

（2）向量数据库：两种查询：标量过滤 + 向量相似度检索（ANN）

5、额外特有操作

MySQL 独有

向量库独有

三、简明总结

相关文章：