当前位置: 首页 > news >正文

Elasticsearch:跨数据库与业务系统进行搜索

概述

Elasticsearch 简介

Elasticsearch 提供多种搜索技术,从 BM25 开始,这是文本搜索的行业标准。它还提供由 AI 模型驱动的语义搜索,可以基于上下文与意图提升搜索结果。

在本指南中,你将学习如何将外部数据库中的数据同步到 Elasticsearch,并使用语义搜索轻松检索你的数据库。

更多有关如何安装 Elastic Stack 的信息,请参考文章《如何在 Linux,MacOS 及 Windows 上进行安装 Elasticsearch》

导入你的数据

如何进行数据摄取与增强以支持搜索

Elasticsearch 提供了丰富的数据导入能力,帮助解决你的业务问题。观看该网络研讨会可以:

  • 学习如何将分散的数据汇聚到一个地方,从而构建搜索体验。
  • 了解适用于不同数据类型的工具,包括 Open Crawler、连接器目录、数据与 ML 推理管道等。
  • 观看使用客户支持数据集的实时演示。

创建 Elastic Cloud 项目

开始 14 天试用。访问 cloud.elastic.co 并创建账户后,按照以下步骤启动你的第一个 Elasticsearch Serverless 项目。

首先,选择Elasticsearch

创建一个通用用途的项目。将其命名为“ My project ”,然后点击“Create project”。

你的 Elasticsearch Serverless 项目现在将被创建。接下来,创建你的第一个 Elasticsearch 索引,并将其命名为“ my-index ”。点击 “Create my index”。

接下来,你可以将第三方数据源添加到 Elasticsearch。在这个示例中,我们有一个 MongoDB 数据库,包含大约 150,000 条电子游戏标题记录,以及字段“ id ”、“ name ”、“ description ”和“ date ”。我们将把这个数据库同步到 Elasticsearch,并额外为其添加语义搜索能力。

让我们创建一个基础的索引映射,字段名保持一致,并额外添加“ description_semantic ”字段,用于存储语义搜索的向量。打开Dev Tools,并粘贴以下命令来更新你的索引映射:

PUT my-index/_mappings { "properties": { "name": { "type": "text" }, "description": { "type": "text", "copy_to": "description_semantic" }, "description_semantic": { "type": "semantic_text" }, "date": { "type": "date" } } }

从现有数据库获取数据

你已经可以连接到一个现有数据库。点击“ Connectors ”,然后点击 “+ Self-managed connector”。

本指南将使用 MongoDB 数据库。从 Connector type 列表中选择 MongoDB。

按照说明使用 Docker 部署一个自托管 connector。你需要创建一个 config.yml 文件。注意connectorElasticsearch上的 api_key 是相同的。例如:

connectors: - connector_id: KPIDOZUBfX6AM3jXM_g7 service_type: mongodb api_key: RGZMUU9KVUJmWDZBTTNqWFRQano6R3RRb01jR2kxRkNqWTA5eGtSa3NFZw== elasticsearch: host: https://my-project-cc67ad.es.us-east-1.aws.elastic.cloud:443 api_key: RGZMUU9KVUJmWDZBTTNqWFRQano6R3RRb01jR2kxRkNqWTA5eGtSa3NFZw==

然后,使用以下命令启动自托管 connector:

docker run -v "./connectors-config:/config" --tty --rm docker.elastic.co/enterprise-search/elastic-connectors:8.17.0 /app/bin/elastic-ingest -c /config/config.yml

接下来,将配置添加到你的 MongoDB 数据库中,然后点击Next

选择需要同步数据的索引——在本例中是我们之前创建的 “ my-index ”。点击 “Sync”。

就是这样!该 connector 将遍历数据库并把文档同步到“ my-index ”。主 Connectors 页面会显示当前状态。

Connector 也可以配置为定期将数据库同步到 Elasticsearch。为此,点击该 connector,然后点击“Scheduling”,选择“ every hour ”,再点击“Save”。现在,只要自托管 connector 运行正常,内容就会在每小时整点进行同步。

使用 Elasticsearch

查询数据

现在有趣的部分开始了。进入 Build > Dev Tools(也就是我们之前用来更新索引映射的地方),执行以下查询,该查询将在 “ name ” 和 “ description ” 字段上进行全文搜索:

GET my-index/_search { "query": { "multi_match": { "query": "adventure game on a desert island", "fields": [ "name", "description" ] } } }

由于该索引现在包含 semantic_text 字段,你可以像这样进行查询:

GET my-index/_search { "query": { "semantic": { "field": "description_semantic", "query": "game about ghosts in medieval times" } } }

你刚刚学习了如何将外部数据库中的数据同步到 Elasticsearch,并在其之上添加语义搜索!

下一步

感谢你花时间学习如何在 Elastic Cloud 中使用 Python 构建你的第一个搜索查询。在你开启 Elastic 之旅时,了解一些在整个环境中部署时需要管理的运维、安全和数据相关组件是很重要的。

准备开始了吗?你可以在 Elastic Cloud 上启动一个免费的 14 天试用,或尝试这些关于 Search AI 101 的 15 分钟实操学习。

开始免费试用

附加资源

  • 开始使用 Elasticsearch
  • 构建 AI 驱动的搜索体验
  • 配置向量搜索
  • 在 Elasticsearch 上构建应用
  • 连接 Elasticsearch API

原文:https://www.elastic.co/getting-started/enterprise-search/search-across-business-systems-and-software

http://www.jsqmd.com/news/902912/

相关文章:

  • 甲方要的‘裸眼3D’大屏互动?别慌,这份Unity+3dsMax低成本实现方案请收好
  • 告别官方文档:Jetson Xavier NX内核编译与设备树替换的民间实战指南(基于L4T R32.6.1)
  • 深圳市深创机电设备:佛山靠谱的中央空调回收公司找哪家 - LYL仔仔
  • 深入理解 Claude Code 的 .claude 配置目录
  • GHDRL:图神经网络与强化学习优化联盟链区块传播
  • 初一初二 CSP-J CSP-S省一训练计划
  • 别再死记硬背了!用CubeMX图形化搞定STM32F405时钟树配置(附代码生成)
  • 别再为云上多租户安全发愁了:手把手配置华为防火墙虚拟系统做安全网关
  • 告别mmwaveStudio卡顿!手把手教你用Python脚本+DCA1000采集IWR1642原始数据
  • 海淘雪茄靠谱平台推荐:CH站(Cigarhome)正品行货、资质齐全、香港自提一站式攻略 - damaigeo
  • Efficient-KAN深度解析:高效Kolmogorov-Arnold网络实战指南
  • 实用指南:用ExplorerPatcher轻松定制你的Windows桌面体验
  • 企业法务如何高效管理外部律师?从选聘到考核的协作管理实践
  • 抖音无水印下载终极指南:3分钟快速上手douyin-downloader
  • 深度解析:创新智能缠论量化分析系统chanvis的技术架构与实战应用
  • AMD Ryzen终极性能调优指南:SMUDebugTool免费解锁硬件调试潜能
  • 深度探索Loop窗口管理器:5个实战技巧解决快捷键冲突问题
  • Word文档导出为图片的方法有哪些?2026保姆级教程一看就会
  • 2026年汕头全屋定制怎么选?澄海兔宝宝易装定制与主流品牌深度横评 - 年度推荐企业名录
  • STM32F103C8T6 + MPU6050 陀螺仪漂移?手把手教你用线性回归函数搞定角度误差
  • 3个步骤,让你的技术文章代码从“黑白色“升级为“彩色专业版“
  • 终极怀旧游戏复活指南:如何在Windows 11上轻松启用IPX/SPX协议支持
  • CE-CF24串 锂电池模组均衡维护仪,均衡单体电压,消除整组压差,一站式锂电均衡修复解决方案 - 勇士快跑
  • 基于Azure AI构建企业级智能对话机器人:从RAG架构到实战指南
  • CAD怎么转PDF?2026年最新保姆级教程,4种方法一看就会
  • STM32 HAL库外部中断捕获PPM信号避坑指南:为什么你的通道值总跳变?
  • ShowDoc旧版本文件上传漏洞实战复现(CNVD-2020-26585,附PHPStudy环境搭建)
  • 让设计更有温度——网页设计心理学实战指南
  • 对比直接调用与通过 Taotoken 调用大模型的响应体感差异
  • 告别模糊时代:用Real-ESRGAN-GUI轻松实现图片高清修复的终极指南