当前位置: 首页 > news >正文

Java_ElasticSearch(ES)——分布式搜索引擎

介绍:

Elasticsearch是一个开源的分布式搜索和分析引擎,最初由Elastic公司开发。它构建在Apache Lucene搜索引擎库之上,提供了一个强大的全文搜索和分析引擎,它结合kibana、Logstash、Beats,是一整套技术栈,被叫做ELK,适用于各种用例,包括文本搜索、日志分析、实时数据分析、监控和报警等。

官网:

官网地址:Elastic — The Search AI Company | Elastic,目前最新的版本是8.x.x,国内大多使用6.x.x和7.x.x。

优势:

elasticsearch具备以下优势:

**·**支持分布式。可水平拓展

**·**提供Restful接口,可被任何语言调用

es在处理海量数据搜索时,速度非常的快,是因为它底层采用倒排索引。

★倒排索引:

首先介绍一下正向索引

倒排索引

总结:

IK分词器:

上述配置文件即表示添加扩展词典ext.dic,它就会在当前配置文件所在的目录中找这个文件。

总结:

基础概念:

与MySQL对比:

索引库操作

Mapping映射属性:

索引库操作:

总结:

文档处理:

CRUD:

新增:

查找、删除:

修改:
全量修改:

这种方式在文档id不存在时,就会相当于一个新增操作。

增量修改:

批量处理:

JavaRestClient:

客户端初始化:

商品表Mapping映射:

以商品表举例:

在kibana中写出即为:

PUT /items { "mappings": { "properties": { "id": { "type":"keyword" }, "name":{ "type": "text", "analyzer": "ik_smart" }, "price":{ "type": "integer" }, "image":{ "type": "keyword", "index": false }, "category":{ "type": "keyword" }, "brand":{ "type": "keyword" }, "sold":{ "type": "integer" }, "comment_count":{ "type": "integer", "index": false }, "isAD":{ "type": "boolean" }, "update_time":{ "type": "date" } }

索引库操作:

创建索引库的JavaAPI与Restful接口API对比:

操作步骤:

代码演示:
class ItemTest { private RestHighLevelClient client; @BeforeEach void setUp() { // 初始化 RestHighLevelClient 对象 client = new RestHighLevelClient(RestClient.builder( HttpHost.create("http://192.168.178.130:9200") )); } @AfterEach void tearDown() throws IOException { client.close(); } @Test void testCreateIndex() throws IOException { //1.准备Request对象 CreateIndexRequest request = new CreateIndexRequest("items"); //2.准备请求参数 request.source(MAPPING_TEMPLATE, XContentType.JSON); //3.发送请求 client.indices().create(request, RequestOptions.DEFAULT); } @Test void testGetIndex() throws IOException { //1.准备Request对象 GetIndexRequest request = new GetIndexRequest("items"); //2.发送请求 boolean exists = client.indices().exists(request, RequestOptions.DEFAULT); System.out.println("exists: " + exists); } @Test void testDeleteIndex() throws IOException { //1.准备Request对象 DeleteIndexRequest request = new DeleteIndexRequest("items"); //2.发送请求 client.indices().delete(request, RequestOptions.DEFAULT); } private static final String MAPPING_TEMPLATE = "{ " + " "mappings": { " + " "properties": { " + " "id": { " + " "type":"keyword" " + " }, " + " "name":{ " + " "type": "text", " + " "analyzer": "ik_smart" " + " }, " + " "price":{ " + " "type": "integer" " + " }, " + " "image":{ " + " "type": "keyword", " + " "index": false " + " }, " + " "category":{ " + " "type": "keyword" " + " }, " + " "brand":{ " + " "type": "keyword" " + " }, " + " "sold":{ " + " "type": "integer" " + " }, " + " "comment_count":{ " + " "type": "integer", " + " "index": false " + " }, " + " "isAD":{ " + " "type": "boolean" " + " }, " + " "update_time":{ " + " "type": "date" " + " } " + "} " + "} " + "}"; }

文档操作:

新增文档:

运行代码:
@SpringBootTest(properties = "spring.profiles.active=local") class ESDocTest { private RestHighLevelClient client; @Autowired private IItemService itemService; @BeforeEach void setUp() { // 初始化 RestHighLevelClient 对象 client = new RestHighLevelClient(RestClient.builder( HttpHost.create("http://192.168.178.130:9200") )); } @AfterEach void tearDown() throws IOException { client.close(); } @Test void testIndexDoc() throws IOException { //获取数据 Item item = itemService.getById(317578L); ItemDoc itemDoc = BeanUtil.copyProperties(item, ItemDoc.class); //创建request对象 IndexRequest request = new IndexRequest("item").id(itemDoc.getId()); //准备JSON文档 request.source(JSONUtil.toJsonStr(itemDoc), XContentType.JSON); //发送请求 client.index(request, RequestOptions.DEFAULT); } }
删除文档:

查询文档:

修改文档:

全量更新:可以使用新增文档的代码,在得到ItemDoc后修改它的属性值在新增即可。

局部更新:

文档操作基本步骤:

批处理:

代码示例:

DSL查询:

快速入门:

注意:单次查询默认最大数据数为10000,最多返回10条数据

叶子查询:

全文检索:

FIELD为要搜索的字段,TEXT为要搜索的内容

精确查询:

term查询一般用来搜不分词的字段,比如品牌等。如果搜分词的字段,VALUE只能写分好的词条,比如“脱脂”、“牛奶”等,才能搜到

range查询中gte和lte也可以写成gt和lt这样就是大于和小于。

ids查询:(批量查询id)

总结:

复合查询:

布尔查询:

示例:

搜索“智能手机”,但品牌必须是华为,价格必须是900~1599

排序和分页:

排序:

示例:

搜索商品,按照销量排序,销量一样则按照价格排序。

分页:

示例:

搜索商品,查询出销量排名前10的商品,销量一样时按照价格升序。

深度分页问题:

解决方案:

高亮显示:

(↑标签默认就为em)

搜索完整语法:

JavaRestClient查询:

快速入门:

构建查询条件:

全文检索查询:

精确查询:

布尔查询:

排序和分页:

高亮显示:

聚合:

聚合的分类:

DSL实现聚合:

Java客户端实现聚合:

构造请求参数:

解析结果:

http://www.jsqmd.com/news/212021/

相关文章:

  • 手写一个单例模式 (考虑线程安全)。
  • 深度学习毕设选题推荐:基于python的CNN训练识别吃的美食基于深度学习的CNN训练识别吃的美食
  • 深度学习毕设项目推荐-深度学习基于python的CNN训练识别吃的美食基于python的深度学习CNN训练识别吃的美食
  • 救命神器!9个AI论文网站测评:本科生毕业论文全攻略
  • ReadView的结构和工作原理?
  • Java 进阶:如何让线程主动让出 CPU
  • 亲测好用10个AI论文工具,专科生轻松搞定论文写作!
  • JavaScript 调试
  • AngularJS 模块详解
  • 救命神器!自考必看TOP9 AI论文网站测评与推荐
  • idea创建springBoot的五种方式
  • 毫米波V2I网络的链路层仿真研究(Matlab代码实现)
  • Java实战:Spring Boot application.yml配置文件详解
  • python_flask求职招聘岗位信息分析系统的设计与实现_xz0yin70可视化大屏
  • Prompt Tuning动态选医疗特征提速诊断
  • idea、mybatis报错Property ‘sqlSessionFactory‘ or ‘sqlSessionTemplate‘ are required
  • Azure GPv1 存储账户迁移至 GPv2 完整指南
  • Java学习进阶知识篇
  • Memcached 连接:深入理解与优化实践
  • 深度学习计算机毕设之基于python训练鲜花识别基于卷神经网络训练鲜花识别
  • HeidiSQL导入与导出数据
  • 2026最全Gemini学生优惠申请指南
  • AS7341可见光谱传感器原理图设计,已量产(光线传感器)
  • 文档解析API哪个好用
  • 俄罗斯总统透露:美国想在扎波罗热核电站进行加密货币挖矿?
  • 三一重工标杆企业游学—走进名企,对标精益生产管理
  • IDEA + Spring Boot 的三种热加载方案,看完弄懂,不用加班
  • 2026Teng讯总部游学:解码数字经济,锚定营销增长新坐标
  • 深度学习毕设选题推荐:基于人工智能的玉米粒品质检测基于深度学习的玉米粒品质检测
  • 环境振动估算阻尼比 (SDOF)研究(Matlab代码实现)