Python实用技法第27篇:编写多行模式的正则表达式

发布时间:2019-08-05 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了Python实用技法第27篇:编写多行模式的正则表达式脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
上一篇文章Python实用技法第26篇:定义实现最短匹配的正则表达式
下一篇文章:Python实用技法第28篇:将Unicode文本统一表示为规范形式

1、需求????

我们打算用正则表达式对一段文本块做匹配,但是希望在进行匹配时能够跨越多行。

2、解决方案????

@H_304_14@这个问题一般出现在希望使用句点(.)来匹配任意字符,但是忘记了句点并不能匹配换行符。

实例:假设向匹配c语言风格的注释:

import re

str_pat=re.COMpile(r'/*(.*?)*/')
text1="/* mark */"
text2='''/* mark 
            2018    */'''
PRint(str_pat.findall(text1))
print(str_pat.findall(text2))

结果:

[' mark ']
[]

要解决这个问题,可以添加对换行符的支持。

实例:

import re

#将.换成(?:.|n)
str_pat=re.compile(r'/*((?:.|n)*?)*/')
text1="/* mark */"
text2='''/* mark 
            2018    */'''
print(str_pat.findall(text1))
print(str_pat.findall(text2))

结果:

[' mark ']
[' mark n 2018 ']

(?:.|n)指定了一个非捕获组(即,这个组只做匹配但不捕获结果,也不会分配组号)。

3、分析????

re.compile()函数可接受一个有用的标记:re.DOTALL,这使得表达式中的句点【.】可以匹配所有的字符,也包括换行符。

实例:

import re

str_pat=re.compile(r'/*(.*?)*/',re.DOTALL)
text1="/* mark */"
text2='''/* mark 
            2018    */'''
print(str_pat.findall(text1))
print(str_pat.findall(text2))

结果:

[' mark ']
[' mark n 2018 ']

对于简单的情况,使用re.DOTALL标记就可以很好的完成工作。但是如果要处理及其复杂的模式,可以选择利用非捕获组定义在自己的表达式中,这样无需额外的标记也能正常工作。

上一篇文章:Python实用技法第26篇:定义实现最短匹配的正则表达式
下一篇文章:Python实用技法第28篇:将Unicode文本统一表示为规范形式

脚本宝典总结

以上是脚本宝典为你收集整理的Python实用技法第27篇:编写多行模式的正则表达式全部内容,希望文章能够帮你解决Python实用技法第27篇:编写多行模式的正则表达式所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。