脚本宝典收集整理的这篇文章主要介绍了

Python实用技法第25篇:正则:以不区分大小写的方式对文本做查找和替换

脚本宝典小编觉得挺不错的,现在分享给大家,也给大家做个参考,希望能帮助你少写一行代码,多一份安全和惬意。

上一篇文章:Python实用技法第24篇:正则:查找和替换文本
下一篇文章:Python实用技法第26篇:定义实现最短匹配的正则表达式

1、需求????

我们需要以不区分大小写的方式在文本中进行查找,可能还需要做替换。

2、解决方案????

要进行不区分大小写的文本操作,我们需要使用re模块并且对各种操作都要加上re.IGNORECASE标记。

示例:

import re
text='Mark is a handsome guy and mark is only 18 years old.'
result1=re.findall('mark',text,flags=re.IGNORECASE)
result2=re.sub('mark','python',text,flags=re.IGNORECASE)

print(result1)
print(result2)

结果:

['Mark', 'mark']
python is a handsome guy and python is only 18 years old.

上面例子揭示了一种局限,就是虽然名字从【mark】替换为【python】,但是大小写并不吻合,例如第一个人名替换后应该也是大写:【Pyhton】。

如果想要修正这个问题,需要用到一个支撑函数,实例如下:

import re
text='Mark is a handsome guy and mark is only 18 years old.MARK'

def matchcase(word):
    def replace(m):
        #re.sub会将匹配到的对象,循环调用replace方法传入
        print(m)
        #获取匹配的文本
        text=m.group()
        if text.isupper():
            #如果文本全部是大写,就返回word的全部大写模式
            return word.upper()
        elif text.islower():
            # 如果文本全部是小写,就返回word的全部小写模式
            return word.lower()
        elif text[0].isupper():
            #如果文本是首字母大写,就返回word的首字母大写模式
            return word.capitalize()
        else:
            #其他情况,直接返回word
            return word
    return replace

result=re.sub('mark',matchcase('python'),text,flags=re.IGNORECASE)

print(result)

运行结果:

<re.Match object; span=(0, 4), match='Mark'>
<re.Match object; span=(27, 31), match='mark'>
<re.Match object; span=(53, 57), match='MARK'>
Python is a handsome guy and python is only 18 years old.PYTHON

3、分析????

对于简单的情况,只需加上re.IGNORECASE标记足以进行不区分大小写的匹配操作了。

但请注意,对于某些涉及大写转换的Unicode匹配来说可能是不够的,以后章节会讲到。

上一篇文章:Python实用技法第24篇:正则:查找和替换文本
下一篇文章:Python实用技法第26篇:定义实现最短匹配的正则表达式

总结

以上是脚本宝典为你收集整理的

Python实用技法第25篇:正则:以不区分大小写的方式对文本做查找和替换

全部内容,希望文章能够帮你解决

Python实用技法第25篇:正则:以不区分大小写的方式对文本做查找和替换

所遇到的程序开发问题,欢迎加入QQ群277859234一起讨论学习。如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典网站推荐给程序员好友。 本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。

80%的人都看过