当前位置：首页 > news >正文

ORB-SLAM3 关键帧相似度计算

news 2026/7/2 3:37:12

float si = mpVoc->score(F->mBowVec, pKFi->mBowVec);这行代码的核心作用，是计算当前帧与某个候选关键帧在视觉上的相似度得分，得分越高，两者在视觉上就越相似。

这个得分是后续筛选和聚合候选关键帧的基础，也是ORB-SLAM3重定位流程中“粗匹配”的关键一环。

下面将从得分计算方式和算法实现两个层面来详细解释：

📊 得分计算方式：基于词袋向量的相似度

mpVoc->score是DBoW2库提供的接口，其输入是两个词袋向量（BowVector），输出是一个浮点数，代表它们的相似度。

输入是什么？F->mBowVec是当前帧的词袋向量，pKFi->mBowVec是候选关键帧的词袋向量。每个向量都是一个std::map<WordId, WordValue>，记录了该帧图像包含的“视觉单词”及其对应的TF-IDF权重。
如何计算相似度？DBoW2库提供了多种评分方法，例如L1范数、L2范数、卡方距离、点积等。ORB-SLAM3通常使用L1范数评分（L1Scoring），其本质是计算两个词袋向量的加权曼哈顿距离。得分越高，代表两帧共享的视觉单词越多、权重越大，它们在视觉内容上就越相似。

⚙️ 算法实现：为什么这一步是关键？

理解了得分计算方式后，我们再把这个步骤放回DetectRelocalizationCandidates函数的上下文中，就能更清楚地看到它的重要性：

从“粗筛”到“精筛”：在这行代码之前，系统通过倒排索引（mvInvertedFile）快速找出了所有与当前帧有共视单词的关键帧，这是第一步的“粗筛”。
计算精确得分：score()函数就是第二步的“精筛”。它基于TF-IDF权重，为每一个通过粗筛的关键帧计算一个精确的相似度得分。TF-IDF确保了那些罕见但更具区分度的视觉单词（高区分度）对得分的贡献更大，而普遍出现的单词（如天空、墙壁）的贡献被削弱。
指导后续筛选：这个得分会被用于后续的筛选逻辑。例如，代码中常见的策略是：只保留得分大于最高分75%的候选帧，然后将这些高得分帧的得分累加到它们共视图中的邻居帧上，形成“累积得分”，从而找到视觉上最相似的“区域”，而非单个孤立的帧。

💎 总结

mpVoc->score(...)这行代码，本质上是利用DBoW2库提供的相似度计算接口，将两个词袋向量转换为一个量化的视觉相似度得分。这个得分是重定位候选帧筛选流程的核心依据，它让系统能够快速地从成百上千个候选帧中，精确定位到与当前帧视觉上最相似的几个关键帧。

补充：

mpVoc->score(F->mBowVec, pKFi->mBowVec)这行代码，其核心是调用DBoW2库来计算两个词袋向量的相似度得分。在ORB-SLAM3中，默认使用的是L1范数评分（L1 Scoring）方法。

下面，将从代码结构、计算原理和具体例子三个方面来拆解这个过程。

🧱 1. 代码结构：DBoW2的评分家族

在DBoW2库中，score是一个定义在基类GeneralScoring中的纯虚函数。它通过一个宏__SCORING_CLASS来定义不同的评分方法。

cpp

// Thirdparty/DBoW2/DBoW2/ScoringObject.h[reference:6] namespace DBoW2 { /// Base class of scoring functions class GeneralScoring { public: // 纯虚函数：计算两个向量的得分 virtual double score(const BowVector &v, const BowVector &w) const = 0; // ... }; }

ORB-SLAM3支持多种评分方法，并通过宏来声明：

评分方法	宏定义	是否需要归一化
L1范数评分 (L1 Scoring)	`__SCORING_CLASS(L1Scoring, true, L1)`	是
L2范数评分 (L2 Scoring)	`__SCORING_CLASS(L2Scoring, true, L2)`	是
卡方评分 (ChiSquare Scoring)	`__SCORING_CLASS(ChiSquareScoring, true, L1)`	是
KL散度评分 (KL Scoring)	`__SCORING_CLASS(KLScoring, true, L1)`	是
巴氏距离评分 (Bhattacharyya Scoring)	`__SCORING_CLASS(BhattacharyyaScoring, true, L1)`	是
点积评分 (Dot Product Scoring)	`__SCORING_CLASS(DotProductScoring, false, L1)`	否