当前位置: 首页 > news >正文

ES面试题

目录

一、什么是倒排索引?有什么好处?

二、ES了解多少?说说你们公司的ES集群架构。

三、如何进行中文分词?用过哪些分词器?

四、ES写入数据的工作原理是什么?

五、ES查询数据的工作原理是什么?

六、ES部署时,要如何进行优化?


一、什么是倒排索引?有什么好处?

索引: 从ID到内容。

倒排索引: 从内容到ID。好处: 比较适合做关键字检索。 可以控制数据的总量。提高查询效率。

搜索引擎为什么比MySQL查询快? lucence

文章 -》 term ->排序 term dictionary -> term index -》 Posting List -> [文章ID ,[在文章中出现的偏移量],权重 ]TFIDF

二、ES了解多少?说说你们公司的ES集群架构。

ES: 是一个基于Lucene框架的搜索引擎产品。you know for search。提供了Restful风格的操作接口。 ELK

Lucene:是一个非常高效的全文检索引擎框架。java jar

ES的一些核心概念:

1、索引 index : 关系型数据库中的 table

2、文档 document : row

3、字段 field text\keyword\byte : 列

4、映射Mapping : Schema。

5、查询方式 DSL : SQL ES的新版本也支持SQL

6、分片 sharding 和 副本 replicas: index都是由sharding组成的。每个sharding都有一个或多个备份。 ES集群健康状态:

ES的使用场景。ES可以用在大数据量的搜索场景下,另外ES也有很强大的计算能力。用户画像

三、如何进行中文分词?用过哪些分词器?

IK分词器。

四、ES写入数据的工作原理是什么?

1、客户端发写数据的请求时,可以发往任意节点。这个节点就会成为coordinating node协调节点。

2、计算的点文档要写入的分片:计算时就采用hash取模的方式来计算。

3、协调节点就会进行路由,将请求转发给对应的primary sharding所在的datanode。

4、datanode节点上的primary sharding处理请求,写入数据到索引库,并且将数据同步到对应的replica sharding

5、等primary sharding 和 replica sharding都保存好文档了之后,返回客户端响应。

五、ES查询数据的工作原理是什么?

1、客户端发请求可发给任意节点,这个节点就成为协调节点

2、协调节点将查询请求广播到每一个数据节点,这些数据节点的分片就会处理改查询请求。

3、每个分片进行数据查询,将符合条件的数据放在一个队列当中,并将这些数据的文档ID、节点信息、分片信息都返回给协调节点。

4、由协调节点将所有的结果进行汇总,并排序。

5、协调节点向包含这些文档ID的分片发送get请求,对应的分片将文档数据返回给协调节点,最后协调节点将数据整合返回给客户端。

六、ES部署时,要如何进行优化?

1、集群部署优化。

​ 调整ES的一些重要参数。path.data目录尽量使用SSD。定时JVM堆内存大小。

​ 关于ES的参数,大部分情况下是不需要调优的,如果有性能问题,最好的办法是安排更合理的sharding布局并且增加节点数量。

2、更合理的sharding布局:

​ 让sharding和对应的replica sharding尽量在同一个机房。

3、Linux服务器上的一些优化策略:

​ 不要用root用户;修改虚拟内存大小;修改普通用户可以创建的最大线程数。

ES生态: ELK日志收集解决方案- filebeat(读log日志)-> logstash -> ElasticSearch -> kibana、Grafana、自研的报表平台

http://www.jsqmd.com/news/850998/

相关文章:

  • 深度拆解:macOS上的Xbox控制器驱动生态全景图
  • 工厂员工入转调离全流程自动化实操方法 | 2026企业级实在Agent深度实践指南
  • 用Verilog在FPGA上实现实时Sobel边缘检测:从图像缓存到阈值比较的完整流程
  • 宇视云APP导出IPC诊断信息操作指导
  • 2026 玻璃钢管道厂家实力 TOP5:河北舜晨领衔,采购不踩坑+全场景适配 - 速递信息
  • 告别霍尔传感器:手把手教你用电感法搞定无刷电机启动(附Arduino代码)
  • 2026年新疆穴位压力刺激贴选购指南:禹孚无源物理理疗贴深度评测与官方联系方式 - 优质企业观察收录
  • Generative AI applications - What LLMs can and cannot do
  • 迅为iTOP-RK3576开发板评测:从硬件解析到AIoT实战部署
  • ESXi 7.0升级后后悔了?别慌,用VMware Hypervisor Recovery轻松降级(含6.x升7.0特殊说明)
  • 你正在找靠谱吹塑机厂家?这3个选型维度比榜单实用 - 速递信息
  • 微信小游戏性能天花板在哪?用Unity URP项目实测告诉你(附与iOS原生对比)
  • 蒙城悦洁家政服务经营部:安徽房屋漏水维修公司 - LYL仔仔
  • N_m3u8DL-RE流媒体下载器:如何轻松下载加密视频的完整指南
  • kubesphere
  • 从跟跑向领跑跨越,炎怀科技携自主研发TPS导热仪、高精度热台首次亮相2026主动散热与被动散热技术产业大会
  • 从零搭建水文监测数据平台:基于SL651协议与Node-RED的实时解析与可视化
  • 福建旧黄金回收旧银饰回收PT950铂金回收钻戒回收金银铂钻回收高价多少钱一克同城价格查询上门上门估价闲置变现转让靠谱权威排行榜 - 检测回收中心
  • 深圳人注意了!黄金回收报价高不等于到手多,这篇避坑指南帮你省下几千块 - 润富黄金珠宝行
  • 终极跨平台GUI解决方案:深入解析VcXsrv Windows X Server完整技术指南
  • 别再只懂104了!从风扇到芯片,手把手拆解电容在电路里的5种‘隐藏用法’
  • ARM SME指令集UMLSL多向量运算详解
  • 3步掌握ComfyUI-Impact-Pack:让AI图像细节从模糊到惊艳的终极指南
  • GPT-4o vs Claude 3.5 vs DeepSeek:测试工程师该如何选拔大模型?
  • 天龙八部GM工具终极指南:5分钟掌握游戏数据管理核心技巧
  • Flutter状态管理选型指南:Provider、Bloc、Riverpod,我的项目到底该用哪个?
  • LaTeX子图排版避坑指南:为什么你的图总对不齐?从原理到实战一次讲清
  • CAN DBC文件实战:手把手教你用CANdb++为OBD诊断信号建模(含Value Tables技巧)
  • 不同发质护发素推荐:针对染烫受损发质的精选 - 速递信息
  • 涨跌停板制度是什么