当前位置: 首页 > news >正文

洛谷 P3375 【模板】KMP 题解

题目链接

洛谷 P3375 【模板】KMP

KMP 模板题

border:公共前后缀,即若字符串 \(t'\)\(s'\) 的 border,那么 \(t'\) 既是 \(s'\) 的前缀,又是 \(s'\) 的后缀。

模式串、文本串:对于模式串 / 字符串匹配算法,要在文本串中匹配模式串,即在文本串中找出模式串。

声明:下文中字符串第 \(i\) 位均从 \(1\) 开始,如字符串 abcab 的第三位是 c

算法介绍

KMP 算法,由 D.E.Knuth、J.H.Morris、V.R.Pratt 三位科学家共同发明,是一种具有线性时间复杂度的模式串匹配算法,即在文本串 \(s\) 中找出所有与模式串 \(t\) 完全相同的字串只需要 \(O(|s|+|t|)\) 的优秀复杂度。

思路分析

对于一般的 BF(Brute Force)算法(即最朴素的暴力枚举),每次失配后,我们都需要回到模式串的开头重新匹配,时间复杂度最坏可达到 \(O(|s|\times|t|)\)

而对于 KMP 算法,我们发现,在图中第一次匹配完成后,可以直接将模式串的第一个字符 a 移到文本串的第三个字符 a,而无需一个个遍历过来。那么如何实现呢?我们观察发现,这个 a 既是模式串 aba 的前缀,也是它的后缀,即这个 a 是模式串的公共前后缀,所以移过来之后这个 a 仍然匹配。

再举一个例子,模式串为 abcabd,文本串为 abcabcababcad。当我们匹配到第六位时发现失配(即当前字符不同),由于模式串前五位 abcab 的最长公共前后缀为 ab,所以我们可以直接把模式串的第三位移至文本串的第六位进行匹配,省去了中间的遍历。

即对于模式串匹配出现失配时,记当前已经匹配好了模式串前 \(j\) 位,其最长公共前后缀长度为 \(kmp_j\),对于模式串第 \(j+1\) 位,若对应文本串第 \(i\) 位与其不同,那么只需移动模式串,使 \(j=kmp_j\),再进行比较,直至 \(j=0\) 或下一位匹配成功即可。

通过借助已匹配部分的公共前后缀,我们可以进行更高效率的模式串移动。

for (int i=1,j=0;i<=n;++i){ // s1 为文本串,s2 为模式串while (j && s2[j+1]!=s1[i]) j=kmp[j]; // 模式串移动if (s2[j+1]==s1[i]) ++j; // 尝试匹配if (j==m) printf("%d\n",i-j+1),j=kmp[j]; // 模式串全部匹配成功
}

接下来考虑计算 \(kmp_i\)。还是以 abcab 解释,我们发现其最长公共前后缀为 ab,即如果用模式串取匹配本身,模式串的前缀 ab 可以匹配到后缀 ab。又因为只能让真前缀匹配真后缀,所以应该从作为文本串的模式串的第 \(2\) 位开始匹配。每次循环最后,作为文本串的模式串第 \(i\) 个字符成功匹配模式串第 \(j\) 个字符,说明模式串前 \(i\) 个字符组成的字符串的前 \(j\) 位(在模式串中)可以匹配后 \(j\) 位(在“文本串”中,让 \(kmp_i\gets j\) 即可。

for (int i=2,j=0;i<=m;++i){while (j && s2[j+1]!=s2[i]) j=kmp[j];if (s2[j+1]==s2[i]) ++j;kmp[i]=j;
}

代码呈现

#include<bits/stdc++.h>
using namespace std;const int N=1e6+10;
int kmp[N];
char s1[N],s2[N];int main(){scanf("%s%s",s1+1,s2+1);int n=strlen(s1+1),m=strlen(s2+1);for (int i=2,j=0;i<=m;++i){while (j && s2[j+1]!=s2[i]) j=kmp[j];if (s2[j+1]==s2[i]) ++j;kmp[i]=j;}for (int i=1,j=0;i<=n;++i){while (j && s2[j+1]!=s1[i]) j=kmp[j];if (s2[j+1]==s1[i]) ++j;if (j==m) printf("%d\n",i-j+1),j=kmp[j];}for (int i=1;i<=m;++i) printf("%d ",kmp[i]);return 0;
}
http://www.jsqmd.com/news/817614/

相关文章:

  • Chrome扩展开发实战:给你的插件加个‘智能搜索框’(Omnibox事件监听与搜索建议全解析)
  • 大模型学习指南
  • 基于RAG与本地大模型构建个人知识库AI助手:从原理到实践
  • 别再死记硬背了!用Python代码直观理解欧拉角313(ZXZ)与312(ZXY)转序
  • 安顺招聘网站哪个靠谱:秒聘网正规专业 - 19120507004
  • 群晖DSM 7.2.2视频中心完整恢复方案:轻松解决Video Station无法安装问题
  • Windows计划任务自动化实战:从schtasks命令到运维脚本
  • 2026年5月上海建筑/建设工程纠纷/施工合同纠纷/总包合同纠纷/分包合同纠纷律师哪家好,选上海嘉隆律师事务所王彦民 - 2026年企业推荐榜
  • 手把手教你用中海达HGO软件搞定GNSS静态数据处理(从数据导入到生成报告)
  • 专业级ZPL虚拟打印机解决方案:告别物理设备,提升开发效率50%
  • Modbus调试避坑实录:我用Modsim32抓到了主站程序的三个隐蔽Bug
  • 告别重启!用JRebel插件在IDEA里实现Java代码秒级热更新(附最新激活与离线配置)
  • 别再让POI吃掉你的内存了!用SAX模式轻松处理10万行Excel数据(附完整Java代码)
  • 第四十六天
  • OpenClaw:构建安全自动化部署工具链的实践与架构
  • UWB与蓝牙混合定位技术:从AirTag拆解到物联网寻物应用实践
  • NVM技术如何优化数据库存储引擎性能
  • 紫光同创FPGA + OV5640:除了显示,还能玩出什么花样?一个图像处理小项目的思路分享
  • Cadence 17.4 实战指南:从零到一构建高速PCB设计流程
  • 实战指南:基于Paho-mqtt.js构建前端WebSocket MQTT连接与健壮重连机制
  • 开源灵巧爪项目OpenClaw-Ligong-Feng:从硬件选型到控制算法的完整实践指南
  • 小白也能轻松玩转大模型!收藏这份AI提升效率秘籍
  • 安顺招聘网站哪个岗位多:秒聘网千岗云集 - 17329971652
  • 团队冲刺SCRUM第四天
  • 避坑指南:斐讯N1刷Armbian从U盘启动到EMMC写入,这些细节决定了成败(含uEnv.ini文件解析)
  • 六源音频分离革命:htdemucs_6s模型深度解析与应用实践
  • 收藏!小白程序员快速入门:大模型技能工厂实战全流程解析
  • 解锁网易云音乐NCM格式:让加密音乐重获自由的完整指南
  • 从AUTOSAR RTE到Socket:一文拆解SOME/IP数据在ECU内部的“快递”之旅
  • 安顺招聘网站推荐:秒聘网高效靠谱 - 13724980961