当前位置: 首页 > news >正文

Java_ElasticSearch(ES)——分布式搜索引擎 - 实践

Java_ElasticSearch(ES)——分布式搜索引擎 - 实践

介绍:

Elasticsearch是一个开源的分布式搜索和分析引擎,最初由Elastic公司开发。它构建在Apache Lucene搜索引擎库之上,提供了一个强大的全文搜索和分析引擎,它结合kibana、Logstash、Beats,是一整套技术栈,被叫做ELK,适用于各种用例,包括文本搜索、日志分析、实时数据分析、监控和报警等。

官网:

官网地址:Elastic — The Search AI Company | Elastic,目前最新的版本是8.x.x,国内大多使用6.x.x和7.x.x。

优势:

elasticsearch具备以下优势:

**·**支持分布式。可水平拓展

**·**提供Restful接口,可被任何语言调用

es在处理海量数据搜索时,速度非常的快,是因为它底层采用倒排索引。

★倒排索引:

首先介绍一下正向索引

倒排索引

总结:

IK分词器:

上述配置文件即表示添加扩展词典ext.dic,它就会在当前配置文件所在的目录中找这个文件。

总结:

基础概念:

与MySQL对比:

索引库操作

Mapping映射属性:

索引库操作:

总结:

文档处理:

CRUD:

新增:

查找、删除:

修改:
全量修改:

这种方式在文档id不存在时,就会相当于一个新增操作。

增量修改:

批量处理:

JavaRestClient:

客户端初始化:

商品表Mapping映射:

以商品表举例:

在kibana中写出即为:

PUT /items
{"mappings": {"properties": {"id": {"type":"keyword"},"name":{"type": "text","analyzer": "ik_smart"},"price":{"type": "integer"},"image":{"type": "keyword","index": false},"category":{"type": "keyword"},"brand":{"type": "keyword"},"sold":{"type": "integer"},"comment_count":{"type": "integer","index": false},"isAD":{"type": "boolean"},"update_time":{"type": "date"}
}

索引库操作:

创建索引库的JavaAPI与Restful接口API对比:

操作步骤:

代码演示:
class ItemTest {private RestHighLevelClient client;@BeforeEachvoid setUp() {// 初始化 RestHighLevelClient 对象client = new RestHighLevelClient(RestClient.builder(HttpHost.create("http://192.168.178.130:9200")));}@AfterEachvoid tearDown() throws IOException {client.close();}@Testvoid testCreateIndex() throws IOException {//1.准备Request对象CreateIndexRequest request = new CreateIndexRequest("items");//2.准备请求参数request.source(MAPPING_TEMPLATE, XContentType.JSON);//3.发送请求client.indices().create(request, RequestOptions.DEFAULT);}@Testvoid testGetIndex() throws IOException {//1.准备Request对象GetIndexRequest request = new GetIndexRequest("items");//2.发送请求boolean exists = client.indices().exists(request, RequestOptions.DEFAULT);System.out.println("exists: " + exists);}@Testvoid testDeleteIndex() throws IOException {//1.准备Request对象DeleteIndexRequest request = new DeleteIndexRequest("items");//2.发送请求client.indices().delete(request, RequestOptions.DEFAULT);}private static final String MAPPING_TEMPLATE = "{
" +"  "mappings": {
" +"    "properties": {
" +"      "id": {
" +"        "type":"keyword"
" +"      },
" +"      "name":{
" +"        "type": "text",
" +"        "analyzer": "ik_smart"
" +"      },
" +"      "price":{
" +"        "type": "integer"
" +"      },
" +"      "image":{
" +"        "type": "keyword",
" +"        "index": false
" +"      },
" +"      "category":{
" +"        "type": "keyword"
" +"      },
" +"      "brand":{
" +"        "type": "keyword"
" +"      },
" +"      "sold":{
" +"        "type": "integer"
" +"      },
" +"      "comment_count":{
" +"        "type": "integer",
" +"        "index": false
" +"      },
" +"      "isAD":{
" +"        "type": "boolean"
" +"      },
" +"      "update_time":{
" +"        "type": "date"
" +"      }
" +"}
" +"}
" +"}";
}

文档操作:

新增文档:

运行代码:
@SpringBootTest(properties = "spring.profiles.active=local")
class ESDocTest {private RestHighLevelClient client;@Autowiredprivate IItemService itemService;@BeforeEachvoid setUp() {// 初始化 RestHighLevelClient 对象client = new RestHighLevelClient(RestClient.builder(HttpHost.create("http://192.168.178.130:9200")));}@AfterEachvoid tearDown() throws IOException {client.close();}@Testvoid testIndexDoc() throws IOException {//获取数据Item item = itemService.getById(317578L);ItemDoc itemDoc = BeanUtil.copyProperties(item, ItemDoc.class);//创建request对象IndexRequest request = new IndexRequest("item").id(itemDoc.getId());//准备JSON文档request.source(JSONUtil.toJsonStr(itemDoc), XContentType.JSON);//发送请求client.index(request, RequestOptions.DEFAULT);}
}
删除文档:

查询文档:

修改文档:

全量更新:可以使用新增文档的代码,在得到ItemDoc后修改它的属性值在新增即可。

局部更新:

文档操作基本步骤:

批处理:

代码示例:

DSL查询:

快速入门:

注意:单次查询默认最大数据数为10000,最多返回10条数据

叶子查询:

全文检索:

FIELD为要搜索的字段,TEXT为要搜索的内容

精确查询:

term查询一般用来搜不分词的字段,比如品牌等。如果搜分词的字段,VALUE只能写分好的词条,比如“脱脂”、“牛奶”等,才能搜到

range查询中gte和lte也可以写成gt和lt这样就是大于和小于。

ids查询:(批量查询id)

总结:

复合查询:

布尔查询:

示例:

搜索“智能手机”,但品牌必须是华为,价格必须是900~1599

排序和分页:

排序:

示例:

搜索商品,按照销量排序,销量一样则按照价格排序。

分页:

示例:

搜索商品,查询出销量排名前10的商品,销量一样时按照价格升序。

深度分页问题:

解决方案:

高亮显示:

(↑标签默认就为em)

搜索完整语法:

JavaRestClient查询:

快速入门:

构建查询条件:

全文检索查询:

精确查询:

布尔查询:

排序和分页:

高亮显示:

聚合:

聚合的分类:

DSL实现聚合:

Java客户端实现聚合:

构造请求参数:

解析结果:

http://www.jsqmd.com/news/309953/

相关文章:

  • TOURISE在达沃斯重新定义旅游业:迈向16万亿美元规模的全球经济引擎
  • Java毕设选题推荐:基于springboot的城市轨道交通安全管理系统java-springboot某城市的地铁综合服务管理系统【附源码、mysql、文档、调试+代码讲解+全bao等】
  • Fortitude Biomedicines正式完成1300万美元融资,致力于开发治疗自免和癌症的新型抗体疗法
  • AI 语音克隆技术详解:从原理到应用的完整实战指南
  • 【计算机毕业设计案例】基于SpringBoot3+Vue3的erp仓储管理系统基于springboot的erp仓储管理系统(程序+文档+讲解+定制)
  • 【计算机毕业设计案例】基于springboot的宠物医院管理系统喵喵宠物医院管理系统(程序+文档+讲解+定制)
  • 【Linux开发六】进程概念|进程终止|进程中环境变量|进程创建|父子进程文件共享和竞争关系|监视子进程|孤儿进程和僵尸进程|执行新程序|进程状态与进程关系|父进程信号处理机制对子进程影响|守护进程
  • OpenCV 学习:文档扫描与视频运动检测与跟踪
  • 学会这两个方法,你能读懂所有生信文献图表
  • AI都能读文献了,我们还需要自己读吗?
  • 【2026最新】网络安全从入门到精通(超详细)学习路线!
  • 航电oj:统计字符串中汉字的个数
  • 深入解析:tauri:tauri2.0+vue3+vite打包案例
  • 剑桥大学人工智能领域有影响力人物
  • Python命名空间-作用域-类型注解
  • Java全栈工程师的面试实战:从基础到微服务
  • 动能丨揭榜挂帅——共赢逻辑激活协同新动能
  • TCP并发实现
  • 24位AD测温模块1-100米自动补偿滤波稳采适配各类工控场景
  • 铂电阻温度模块的应用边界?多行业场景汇总告诉你
  • 如何选择靠谱的IT外包公司?这3个核心标准是关键
  • ArcGIS Python零基础脚本开发教程---Python入门
  • 一库统管全域数据:金仓 KingbaseES 多模融合架构与全栈替代实践
  • 树拍易购崩盘:“创新”商业模式下,这些“怪味儿”藏着致命陷阱
  • 初见Vibe Coding:前置准备,在Windows上安装WSL2和终端和npm
  • 大数据领域数据架构的性能监控与优化
  • MathCAD多用户管理策略
  • RAG落地不是拼乐高:三层架构才是知识库的真正骨架
  • RAG不是魔法,是工程:从知识库到企业部署的硬核实践
  • 网络安全年薪天花板92万!2025年缺口破百万,小白如何快速入门拿高薪?(珍藏版)