当前位置: 首页 > news >正文

Python正则表达式之基础篇

正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。

其他编程语言中也有正则表达式的概念,区别只在于不同的编程语言实现支持的语法数量不同。

它拥有自己独特的语法以及一个独立的处理引擎,在提供了正则表达式的语言里,正则表达式的语法都是一样的。

下图展示了使用正则表达式进行匹配的流程:

1.1介绍

正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的部分。

正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。re 模块使 Python 语言拥有全部的正则表达式功能。

1.2要知道的各种用法

模式字符串使用特殊的语法来表示一个正则表达式:

字母和数字表示他们自身。一个正则表达式模式中的字母和数字匹配同样的字符串。多数字母和数字前加一个反斜杠时会拥有不同的含义。标点符号只有被转义时才匹配自身,否则它们表示特殊的含义。反斜杠本身需要使用反斜杠转义。

由于正则表达式通常都包含反斜杠,所以你最好使用原始字符串来表示它们。模式元素(如 r'/t',等价于'//t')匹配相应的特殊字符。

下表列出了正则表达式模式语法中的特殊元素。如果你使用模式的同时提供了可选的标志参数,某些模式元素的含义会改变。

当然这些用法很多,待会会给出经常使用到的用法,多试试就能理解了。

模式

模式描述
^匹配字符串的开头
$匹配字符串的末尾。
.匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。
[...]用来表示一组字符,单独列出:[amk] 匹配 'a','m'或'k'
[^...]不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。
re*匹配0个或多个的表达式。
re+匹配1个或多个的表达式。
re?匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式
re{ n}
re{ n,}精确匹配n个前面表达式。
re{ n, m}匹配 n 到 m 次由前面的正则表达式定义的片段,贪婪方式
a| b匹配a或b
(re)G匹配括号内的表达式,也表示一个组
(?imx)正则表达式包含三种可选标志:i, m, 或 x 。只影响括号中的区域。
(?-imx)正则表达式关闭 i, m, 或 x 可选标志。只影响括号中的区域。
(?: re)类似 (...), 但是不表示一个组
(?imx: re)在括号中使用i, m, 或 x 可选标志
(?-imx: re)在括号中不使用i, m, 或 x 可选标志
(?#...)注释.
(?= re)前向肯定界定符。如果所含正则表达式,以 ... 表示,在当前位置成功匹配时成功,否则失败。但一旦所含表达式已经尝试,匹配引擎根本没有提高;模式的剩余部分还要尝试界定符的右边。
(?! re)前向否定界定符。与肯定界定符相反;当所含表达式不能在字符串当前位置匹配时成功
(?> re)匹配的独立模式,省去回溯。
\w匹配字母数字
\W匹配非字母数字
\s匹配任意空白字符,等价于 [\t\n\r\f].
\S匹配任意非空字符
\d匹配任意数字,等价于 [0-9].
\D匹配任意非数字
\A匹配字符串开始
\Z匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串。c
\z匹配字符串结束
\G匹配最后匹配完成的位置。
\b匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。
\B匹配非单词边界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。
\n, \t, 等.匹配一个换行符。匹配一个制表符。等
\1...\9匹配第n个分组的子表达式。
\10匹配第n个分组的子表达式,如果它经匹配。否则指的是八进制字符码的表达式。

字符类

实例描述
[Pp]ython匹配 "Python" 或 "python"
rub[ye]匹配 "ruby" 或 "rube"
[aeiou]匹配中括号内的任意一个字母
[0-9]匹配任何数字。类似于 [0123456789]
[a-z]匹配任何小写字母
[A-Z]匹配任何大写字母
[a-zA-Z0-9]匹配任何字母及数字
[^aeiou]除了aeiou字母以外的所有字符
[^0-9]匹配除了数字外的字符

特殊字符类

实例描述
.匹配除 "\n" 之外的任何单个字符。要匹配包括 '\n' 在内的任何字符,请使用象 '[.\n]' 的模式。
\d匹配一个数字字符。等价于 [0-9]。
\D匹配一个非数字字符。等价于 [^0-9]。
\s匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\S匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\w匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'。
\W匹配任何非单词字符。等价于 '[^A-Za-z0-9_]'。

1.3re.match函数

re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。

re.match(pattern, string, flags = 0)

pattern 正则表达式

string 匹配的字符串

flags 标志位,用来控制匹配方式,下文会讲

直接上程序:

1

2

3

4

5

6

importstring,re

r="abc"#正则表达式

ifre.match(r,"abc"):#匹配

print'done'

else:

print'defeat'

结果:

done

可以根据上面各表给出的用法,多练练:

1

2

3

4

5

6

7

importstring,re

r="a.c"#正则表达式 . 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。

ifre.match(r,"abc"):

printre.match(r,"abc")

print'done'

else:

print'defeat'

结果:

<_sre.SRE_Match object at 0x01dd6158>

done

注意这里不是显示匹配成功的字符串,re.match() 返回的是一个对象,不成功返回的是none. 我们可以通过group(num)或groups()匹配对象函数来获取匹配表达式。

http://www.jsqmd.com/news/696693/

相关文章:

  • LFM2.5-VL-1.6B快速上手:Gradio WebUI本地部署与常见报错解决指南
  • 2026不锈钢隔断厂家专业度排行:办公楼卫生间隔断、医院卫生间隔断、卫生间隔断材料、商场卫生间隔断、学校卫生间隔断选择指南 - 优质品牌商家
  • 报道 | 2026年5月-2026年7月国际运筹优化会议汇总
  • CoPaw问题解决:部署常见错误排查与多平台接入配置详解
  • 3分钟快速上手:ncmdump终极NCM文件转换完整指南
  • React Grab:打通视觉与代码层,3倍提升AI编程效率
  • 马斯克开大,600亿重金收购Cursor
  • SD3.5 FP8镜像测评:图像质量提升,生成速度更快
  • 第13篇:高级可视化与自定义图表
  • 2026四川充电设备技术解析:四川充电桩升级改造、四川充电桩生产企业、四川充电设备厂家、四川充电设备安装、四川充电设备采购选择指南 - 优质品牌商家
  • 手把手教你搞定DSP与FPGA的EMIF通信:基于TM320C6747和Xilinx 7系列的真实项目调试笔记
  • 时间序列预测中的特征工程与机器学习应用
  • 别再到处找了!GNN入门必备的12个经典图数据集(Cora/Citeseer/Pubmed等)打包下载与一键读取教程
  • 图像识别化技术中的目标检测图像分割与特征提取
  • PP-DocLayoutV3处理扫描合同:关键信息抽取与风险点标注
  • 参数统计假设检验:原理、Python实现与机器学习应用
  • TensorFlow-v2.15镜像扩展实战:快速集成数据分析三件套
  • UniApp多租户商城源码|支持H5、小程序、APP三端发布|含SpringBoot+Vue后台
  • 在嵌入式设备上实现AES-128-CBC:资源受限环境下的C语言加密方案
  • XGBoost学习曲线分析与调参实战指南
  • Diligent在Elevate 2026大会上推出AI董事及智能代理GRC团队
  • 告别传感器毛刺!手把手教你用C++/C实现滑动窗口滤波(附完整代码)
  • 论文AI率太高怎么办实测解法:多方案横评,降重鸟稳居第一
  • Rust的闭包捕获
  • HARDBOILED IR:面向张量计算的编译器优化设计
  • Qwen3.5-2B应用场景:政府公文OCR识别+政策要点提炼+口语化解读
  • 3DMAX新手必看:免费插件ForestPackLite快速上手,5分钟搞定场景绿化
  • Airweave:声明式AI数据编织框架的设计与实战
  • AI与机器学习:概念差异与技术应用解析
  • BrainScaleS-2神经形态计算系统架构与FPGA互连设计