当前位置：首页 > news >正文

Elasticsearch实战：地理位置精准加权，实现基于距离的智能评分排序

news 2026/6/19 13:14:41

Elasticsearch实战：地理位置精准加权，实现基于距离的智能评分排序

- 前言
- 一、核心场景与问题
- - 1.1 典型业务场景
  - 1.2 核心问题
  - 1.3 距离评分实现流程图
- 二、基础准备：地理位置字段定义
- - 2.1 核心数据类型
  - 2.2 创建索引（含地理位置字段）
  - 2.3 插入测试数据
- 三、两种实现方案（按推荐度排序）
- - 方案1：function_score 距离加权评分（企业级首选）
  - - 1. 核心原理
    - 2. 完整DSL实现
    - 3. 关键参数解释
    - 4. 优势
  - 方案2：geo_distance 直接按距离排序（简单场景）
  - - 1. 核心原理
    - 2. DSL实现
    - 3. 适用场景
- 四、进阶实战：多维度加权评分（文本+距离+门店评分）
- - 4.1 业务需求
  - 4.2 终极加权评分DSL
  - 4.3 多维度评分流程图
- 五、距离评分最佳实践与注意事项
- - 5.1 最佳实践
  - 5.2 常见坑点
- 六、总结

🌺The Begin🌺点点关注，收藏不迷路🌺

前言

在本地生活、外卖配送、出行打车、门店检索等业务场景中，「距离」是比关键词匹配更重要的排序因素。

Elasticsearch 默认仅通过文本相关性（BM25）评分排序，无法直接将地理位置距离纳入评分体系。本文将从原理 → 实战 → 优化 → 组合评分全流程，手把手教你实现**「文本相关性 + 地理位置距离」双维度加权评分**，让检索结果既精准又贴合距离需求。

一、核心场景与问题

1.1 典型业务场景

外卖APP：检索「奶茶店」，距离近 + 评分高的店铺优先展示；
招聘平台：检索「Java工程师」，离我近 + 职位匹配的岗位优先推荐；
门店检索：检索「加油站」，距离最近 + 服务匹配的站点优先召回。

1.2 核心问题

ES 默认评分只看文本匹配度，不包含距离权重，导致：

文本匹配但距离很远的文档排在前面，距离近但文本一般的文档排在后面，完全不符合业务逻辑。

1.3 距离评分实现流程图

二、基础准备：地理位置字段定义

2.1 核心数据类型

ES 提供专门的**geo_point** 类型存储经纬度坐标，支持距离计算、范围检索、距离评分。

2.2 创建索引（含地理位置字段）

PUT/store_index{"settings":{"number_of_shards":1},"mappings":{"properties":{"store_name":{"type":"text"},// 门店名称"business":{"type":"text"},// 主营业务"location":{"type":"geo_point"},// 核心：地理位置字段（经纬度）"score":{"type":"float"}// 门店评分}}}

2.3 插入测试数据

POST/store_index/_doc/1{"store_name":"肯德基(朝阳店)","business":"炸鸡 汉堡 快餐","location":{"lat":39.915,"lon":116.404},// 纬度，经度"score":4.8}POST/store_index/_doc/2{"store_name":"麦当劳(王府井店)","business":"汉堡 炸鸡 薯条","location":{"lat":39.910,"lon":116.410},"score":4.7}

三、两种实现方案（按推荐度排序）

方案1：function_score 距离加权评分（企业级首选）

1. 核心原理

使用function_score查询，将文本相关性得分（BM25）与距离衰减得分进行加权计算，生成最终综合得分。

距离衰减函数：gauss（高斯衰减）—— 距离越近，得分越高；距离越远，得分指数下降。

2. 完整DSL实现

需求：检索「炸鸡汉堡」，距离越近权重越高，综合文本+距离排序。

GET/store_index/_search{"query":{"function_score":{"query":{"match":{"business":"炸鸡 汉堡"// 1. 文本匹配查询}},"functions":[{"gauss":{// 2. 高斯距离衰减函数（核心）"location":{"origin":{"lat":39.912,"lon":116.406},// 用户当前位置"scale":"1000m",// 1000米内：得分几乎不衰减"offset":"500m",// 500米内：得分无衰减"decay":0.5// 超过scale距离，得分衰减一半}}}],"boost_mode":"multiply",// 文本得分 × 距离得分 = 最终得分"score_mode":"multiply"}}}

3. 关键参数解释

参数	含义
origin	用户当前经纬度坐标
scale	最佳距离范围，此范围内距离得分最高
offset	偏移量，该范围内不做衰减
decay	衰减系数（0~1），值越小衰减越快

4. 优势

支持文本相关性 + 距离双维度加权；
得分平滑过渡，无断崖式排序；
企业级标准方案，适配90%业务场景。

方案2：geo_distance 直接按距离排序（简单场景）

1. 核心原理

不修改评分，直接通过_geo_distance排序规则，按距离由近到远强制排序。

2. DSL实现

GET/store_index/_search{"sort":[{"_geo_distance":{"location":{"lat":39.912,"lon":116.406},// 用户位置"order":"asc",// 升序：近 → 远"unit":"m",// 距离单位：米(m) / 千米(km)"distance_type":"plane"}}]}

3. 适用场景

只需要就近排序，不关心文本匹配度；
简单地图检索、附近的人/门店功能。

四、进阶实战：多维度加权评分（文本+距离+门店评分）

4.1 业务需求

检索门店时，同时满足3个条件：

文本匹配度高；
距离近；
门店评分高。

4.2 终极加权评分DSL

GET/store_index/_search{"query":{"function_score":{"query":{"match":{"business":"炸鸡"}},"functions":[// 权重1：距离衰减（权重40%）{"gauss":{"location":{"origin":{"lat":39.912,"lon":116.406},"scale":"1000m","decay":0.5}},"weight":0.4},// 权重2：门店评分（权重30%）{"field_value_factor":{"field":"score","factor":0.3}},// 权重3：文本匹配度（权重30%，默认）{"weight":0.3}],"boost_mode":"sum"// 加权求和：总得分 = 距离40% + 评分30% + 文本30%}}}