当前位置：首页 > news >正文

Elasticsearch核心字段：keyword与text深度对比（区别+场景+选型+实战）

news 2026/6/26 0:13:51

Elasticsearch核心字段：keyword与text深度对比（区别+场景+选型+实战）

- 一、前言
- 二、Elasticsearch text 和 keyword 字段：基础定义
- - 2.1 text 字段定义
  - 2.2 keyword 字段定义
- 三、text 和 keyword 处理流程：核心流程图
- - 3.1 text 字段处理流程（分词流程）
  - 3.2 keyword 字段处理流程（不分词流程）
  - 3.3 流程核心区别
- 四、text 和 keyword 核心区别（超详细对比）
- - 4.1 五大核心区别（必掌握）
  - 4.2 表格对比（一目了然）
- 五、text 和 keyword 实战示例（最直观理解）
- - 5.1 示例数据
  - 5.2 text 字段处理结果
  - 5.3 keyword 字段处理结果
- 六、Elasticsearch 多字段特性：fields 最佳实践
- - 6.1 问题场景
  - 6.2 最优 Mapping 配置
  - 6.3 使用方式
- 七、text 和 keyword 常见踩坑总结
- - 7.1 坑1：用 text 做聚合（报错/无结果）
  - 7.2 坑2：用 keyword 做全文搜索（查不到数据）
  - 7.3 坑3：不设置 fields，导致字段无法同时搜索和聚合
- 八、字段类型选型指南（生产直接用）
- - 8.1 必须用 keyword 的场景
  - 8.2 必须用 text 的场景
- 九、总结：text vs keyword 核心口诀
- 十、文末总结
- - 总结

🌺The Begin🌺点点关注，收藏不迷路🌺

一、前言

在Elasticsearch映射（Mapping）设计中，text和keyword是最常用、最容易混淆的两个字符串类型。

90%的ES新手都会踩坑：用错字段类型导致无法精确查询、无法聚合排序、分词混乱、查询缓慢等问题。

本文将从定义、分词原理、处理流程、核心区别、使用场景、实战示例全方位讲解，帮你彻底掌握text和keyword的选型，写出最优Mapping。

二、Elasticsearch text 和 keyword 字段：基础定义

2.1 text 字段定义

text：用于长文本内容，会被分词器拆分成词语，建立倒排索引，适合全文检索。

适用：文章内容、描述、评论、标题等需要搜索的长文本。

2.2 keyword 字段定义

keyword：用于短字符串，不会分词，原样存储和索引，适合精确匹配、聚合、排序、过滤。

适用：状态值、枚举值、标签、手机号、邮箱、IP、ID、城市名称等。

三、text 和 keyword 处理流程：核心流程图

3.1 text 字段处理流程（分词流程）

3.2 keyword 字段处理流程（不分词流程）

3.3 流程核心区别

text：一定会分词，拆分成词语，不支持完整字符串操作
keyword：完全不分词，字符串整体处理，支持精确操作

四、text 和 keyword 核心区别（超详细对比）

4.1 五大核心区别（必掌握）

是否分词
- text：分词
- keyword：不分词
支持的查询方式
- text：支持match全文检索
- keyword：支持term精确匹配
支持的操作
- text：不支持聚合、排序、去重
- keyword：支持聚合、排序、去重、过滤
存储格式
- text：存储分词后的词语
- keyword：存储完整原始字符串
适用长度
- text：长文本
- keyword：短字符串

4.2 表格对比（一目了然）

对比维度	text 字段	keyword 字段
是否分词	是，会拆分词语	否，完整字符串
主要用途	全文搜索、模糊匹配	精确查询、聚合、排序
支持查询	match、match_phrase	term、terms、prefix
聚合/排序	不支持（或性能极差）	完美支持
存储内容	分词后的词语	原始完整内容
典型场景	文章内容、描述、评论	状态、ID、标签、城市、手机号
默认高亮	支持	不常用

五、text 和 keyword 实战示例（最直观理解）

5.1 示例数据

原始字符串：我是中国程序员，热爱Elasticsearch技术

5.2 text 字段处理结果

分词后：
我 / 是 / 中国 / 程序员 / 热爱 / Elasticsearch / 技术

查询程序员→可以命中
查询中国程序员→可以命中
查询完整字符串 →可以命中

5.3 keyword 字段处理结果

存储结果：我是中国程序员，热爱Elasticsearch技术（原样）

查询程序员→无法命中
查询中国程序员→无法命中
查询完整字符串 →可以命中

六、Elasticsearch 多字段特性：fields 最佳实践

6.1 问题场景

一个字段既需要全文搜索，又需要聚合排序怎么办？

答案：text + keyword 共存

6.2 最优 Mapping 配置

PUT /my_index { "mappings": { "properties": { "title": { // 文章标题 "type": "text", // 全文检索 "fields": { "keyword": { // 子字段keyword "type": "keyword", "ignore_above": 256 // 超长字符串不索引 } } } } } }

6.3 使用方式

全文搜索：使用title
聚合/排序：使用title.keyword

七、text 和 keyword 常见踩坑总结

7.1 坑1：用 text 做聚合（报错/无结果）

错误示例： "aggs": { "group_by_city": { "terms": { "field": "city_text" } // text字段无法聚合 } }

7.2 坑2：用 keyword 做全文搜索（查不到数据）

错误示例： { "term": { "content_keyword": "程序员" } } // 无法匹配长文本

7.3 坑3：不设置 fields，导致字段无法同时搜索和聚合

解决方案：统一使用text + keyword结构

八、字段类型选型指南（生产直接用）

8.1 必须用 keyword 的场景

状态值：status(0/1/2)
枚举值：性别、类型、标签
标识字段：userId、orderId、手机号、邮箱
地址信息：国家、省份、城市
需要分组、排序、去重的字段

8.2 必须用 text 的场景

文章正文、内容描述
商品介绍、评论详情
日志长文本
需要全文搜索、模糊匹配的字段

九、总结：text vs keyword 核心口诀

长文本、要搜索 → text
短字符串、要精确/聚合/排序 → keyword
既要搜索又要聚合 → text + keyword 共存
分词与否是本质区别

十、文末总结

text 和 keyword 是 Elasticsearch 最基础、最重要的字符串类型。

text = 分词 = 全文搜索
keyword = 不分词 = 精确匹配+聚合+排序

合理选择字段类型，是Mapping设计的第一步，也是保证查询性能、功能正常的关键。

总结

本质区别：text分词用于全文检索；keyword不分词用于精确匹配
核心能力：text支持搜索，keyword支持聚合、排序、去重
最佳实践：通用字段使用text + fields.keyword双类型
选型口诀：长文本用text，短字符串用keyword
避坑指南：text绝不用于聚合，keyword绝不用于全文搜索

🌺The End🌺点点关注，收藏不迷路🌺

查看全文

http://www.jsqmd.com/news/664304/

从Python 3.8到3.12，从Java 17到21，智能生成代码兼容性断层全解析，附12个可复用CI/CD检测脚本

AGI驱动科学发现的临界点已至（SITS2026实证数据首次公开）

Dockerfile 中的用户权限管理

Phi-4-mini-reasoning快速上手：10分钟完成本地部署与第一个AI应用

CANape项目配置详解：如何为你的ECU（如TC27x）生成正确的Flash组并设置自动重连

Java八股之String、类加载器和双亲委派机制

2026年质量好的消防提升门/工业提升门优质厂家推荐榜 - 行业平台推荐

Git Pull时总报‘无法快进’？试试配置pull.rebase true，一劳永逸

【限时解密】SITS2026闭门演讲精华：AI告警生成不是替代人工，而是重构DevSecOps流水线的6个关键跃迁点

LumiPixel Canvas Quest 新手必看：如何用咒语卷轴生成理想人像

实用指南：如何使用applera1n工具高效绕过iOS 15-16激活锁限制

2026年评价高的无菌实验室净化工程/广东无菌实验室净化工程/深圳无菌实验室净化工程实力工厂推荐 - 行业平台推荐

Java八股之GC 垃圾回收机制和OOM

丹青识画部署案例：中小企业低成本搭建文化AI交互终端

PowerShell脚本转EXE终极指南：告别命令行，拥抱图形化编译体验

为什么92%的CI/CD流水线漏报关键影响？SITS2026标准解读：3类语义漂移场景+2种跨语言调用链追踪方案

幻境·流金1024高清图生成：8K显示器直出无压缩效果实拍展示

代码生成后必须做的4项成本校验：否则每千行将埋下$1,840/年的隐形负债（Gartner认证方法论）

2026年靠谱的不锈钢卧式水箱/西安水箱/承压水箱推荐厂家精选 - 行业平台推荐

别再傻傻编译整个论文了！用TexStudio实现LaTeX分章节独立调试（附完整代码）

Linux逆向实战：用readelf和objdump亲手分析一个.o文件的.rela.text节

智能生成代码=自动埋雷？紧急预警：这4种AST语义漂移将绕过所有静态扫描器——附实时回滚决策树（已落地金融级生产环境）

快手大模型二面：假如说要设计一个多轮对话Agent，你会怎么设计？

降AI率工具排行榜前10名对比，最后发现只有3款靠谱

nli-distilroberta-base实操手册：企业级NLI服务部署与多场景API集成指南

如何让ROS2编译完后自动source环境变量

2026年质量好的物流门封/月台门封/东台冷库门封优质厂家推荐榜 - 行业平台推荐

全球仅存5份的AGI发展风险对齐时间轴（NSF/DoD/中科院机密评估版节选），2024Q3更新后3处重大修订预警

golang如何读写YAML配置文件_golang YAML配置文件读写解析

Elasticsearch核心字段：keyword与text深度对比（区别+场景+选型+实战）

一、前言

二、Elasticsearch text 和 keyword 字段：基础定义

2.1 text 字段定义

2.2 keyword 字段定义

三、text 和 keyword 处理流程：核心流程图

3.1 text 字段处理流程（分词流程）

3.2 keyword 字段处理流程（不分词流程）

3.3 流程核心区别

四、text 和 keyword 核心区别（超详细对比）

4.1 五大核心区别（必掌握）

4.2 表格对比（一目了然）

五、text 和 keyword 实战示例（最直观理解）

5.1 示例数据

5.2 text 字段处理结果

5.3 keyword 字段处理结果

六、Elasticsearch 多字段特性：fields 最佳实践

6.1 问题场景

6.2 最优 Mapping 配置

6.3 使用方式

七、text 和 keyword 常见踩坑总结

7.1 坑1：用 text 做聚合（报错/无结果）

7.2 坑2：用 keyword 做全文搜索（查不到数据）

7.3 坑3：不设置 fields，导致字段无法同时搜索和聚合

八、字段类型选型指南（生产直接用）

8.1 必须用 keyword 的场景

8.2 必须用 text 的场景

九、总结：text vs keyword 核心口诀

十、文末总结

总结

相关文章：