本篇内容主要讲解“Python正则表达式特别之处是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python正则表达式特别之处是什么”吧!
一、什么是Python正则表达式
在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则(或称为模式)的字符串的需要。正则表达式就是用于描述这些规则(或模式)的工具。换句话说,正则表达式就是记录文本规则的代码。一旦发现了符合要求的文本,就可以用对其进行相应的修改了。
大家还记得Windows命令行中用于文件查找的通配符吧,即*和?。当我们查找某目录下所有的PDF文档的时候,只要搜索*.pdf即可。在这里,*会被解释成任意的字符串。和通配符类似,正则表达式也是用来进行文本匹配的工具,只不过较之于通配符,它能更精确地描述你的需求,例如用来查找一个web页面中的所有电话号码。
我们知道,电话号码一般都有一个固定的写法:区号-电话号码,即有以0开头,后跟2-3个数字,然后是一个连字号“-”,***是7或8位数字组成的字符串(例如010-12345678或0634-1234567)。
二、最简单的正则表达式
学习正则表达式的***方法是从具体的示例入手,让读者亲自动手实验。下面给出了不少简单的例子,并对它们作了详细的说明。当我们在一字符串中查找to,你可以使用正则表达式to。这几乎是最简单的正则表达式了,它可以精确匹配这样的字符串;
由两个字符组成,前一个字符是t,后一个是o。为了演示,我们提供了一个函数re_show(),可以把看作是re模块的一个封装器,它会把给定的字符串中匹配(说某个字符串与某个正则表达式匹配。
通常是指这个字符串里有一部分或几部分或全部能满足表达式给出的条件)的内容加上一个花括号。现在我们不对该函数做进一步的介绍。您只要知道re_show()的***个参数是一个Python正则表达式,第二个参数是要匹配的字符串,当找到匹配的内容时,就用花括号将它括起来就行了。还是源代码如下:
import re def re_show(pat, s): print re.compile(pat, re.M).sub("{/g<0>}", s.rstrip()),'/n' s = '''Python runs on Windows, Linux/Unix, Mac OS X, OS/2, Amiga, Palm Handhelds, and Nokia mobile phones. Python has also been ported to the Java and .NET virtual machines.''' re_show("to",s)
其中,函数调用re_show("to",s)的作用就是查找字符串s中是否包含字符串to,或者说字符串s是否匹配正则表达式to;如果匹配的话,就给字符串to加上花括号。
三、匹配单词的Python正则表达式
我们看到,如果仅仅要求找出文本中的字符串to的话,上面的正则表达式还是可以的,但是如果要想匹配文本中的单词to的话,上面的正则表达式to就不够用了。例如,将上面的代码中的字符串s的定义改为下面的样子:
s = '''In company or association with respect to place or time; as, to live together in one house; to live together in the same age; they walked together to the town.'''
我们发现,上面的文字中,不仅单词to,此外像together和town这些单词中也包含字符串to,如果这时再用上面的Python正则表达式to来查找“单词”to的话,就会出错了。
到此,相信大家对“Python正则表达式特别之处是什么”有了更深的了解,不妨来实际操作一番吧!这里是亿速云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/230973.html