Linux-正则-Reg详解程序员

注意: Linux 正则表达式

一,基础正则第一波字符说明:

二,基础正则第二波字符说明:

三,基础正则第三波:

四,扩展的正则表达式 egrep

1) + :加号表示重复”1个或者1个以上” 前面的字符（* 代表0个或是多个）

2) ? :表示重复“0个或1个”前面的字符

3) | :表示同时过滤多个字符

4) （）：表示分组过滤后向引用

基本组成部分：

正则表达式的基本组成部分。

正则表达式	描述	示例
/	转义符，将特殊字符进行转义，忽略其特殊意义	a/.b匹配a.b，但不能匹配ajb，.被转义为特殊意义
^	匹配行首，awk中，^则是匹配字符串的开始	^tux匹配以tux开头的行
$	匹配行尾，awk中，$则是匹配字符串的结尾	tux$匹配以tux结尾的行
.	匹配除换行符/n之外的任意单个字符，awk则中可以	ab.匹配abc或bad，不可匹配abcd或abde，只能匹配单字符
[ ]	匹配包含在[字符]之中的任意一个字符	coo[kl]可以匹配cook或cool
[^ ]	匹配[^字符]之外的任意一个字符	123[^45]不可以匹配1234或1235，1236、1237都可以
[ – ]	匹配[]中指定范围内的任意一个字符，要写成递增	[0-9]可以匹配1、2或3等其中任意一个数字
?	匹配之前的项1次或者0次	colou?r可以匹配color或者colour，不能匹配colouur
+	匹配之前的项1次或者多次	sa-6+匹配sa-6、sa-666，不能匹配sa-
*	匹配之前的项0次或者多次	co*l匹配cl、col、cool、coool等
()	匹配表达式，创建一个用于匹配的子串	ma(tri)?匹配max或maxtrix
{ n }	匹配之前的项n次，n是可以为0的正整数	[0-9]{3}匹配任意一个三位数，可以扩展为[0-9][0-9][0-9]
{n,}	之前的项至少需要匹配n次	[0-9]{2,}匹配任意一个两位数或更多位数
{n,m}	指定之前的项至少匹配n次，最多匹配m次，n<=m	[0-9]{2,5}匹配从两位数到五位数之间的任意一个数字
\|	交替匹配\|两边的任意一项	ab(c\|d)匹配abc或abd

扩展正则表达式

元字符	作用
\|	管道符，表示“或”，即匹配其中任何一个，”book\|desk”将匹配”book”或”desk”
()	小括号，可以将正则字符和元字符或表达式进行组合，”(book\|desk)s”将匹配”books”或”desks”
?	问号，匹配0个或1个前导表达式，如”a?”匹配其他字符串或a
/<	反斜杠+小于号，词首定位符， “/< abc”表示所有包含以”abc”开头的单词的行
/>	反斜杠+大于号，词尾定位符， “/>abc”表示所有包含以”abc”结尾的单词的行
–	减号，用于指明字符范围， “[a-c]”将匹配包含a、b和c中任意一个字符的字符串
+	加号，匹配一个或多个前导表达式，相当于 expr{1,}

注：grep -E pattern file才能在pattern匹配扩展正则表达式

POSIX字符类

POSIX字符类是一个形如[:…:]的特殊元序列（meta sequence），他可以用于匹配特定的字符范围。

POSIX regular expressions offer two classes of whitespace: [[:space:]] and [[:blank:]]:

[[:blank:]] means space and tab. This makes it similar to: [ /t].
[[:space:]], in addition to space and tab, includes newline, linefeed, formfeed, and vertical tab. This makes it similar to: [ /t/n/r/f/v].

A key advantage of using character classes is that they are safe for unicode fonts.

元字符

元字符（meta character）是一种Perl风格的正则表达式，只有一部分文本处理工具支持它，并不是所有的文本处理工具都支持。

原创文章，作者：奋斗，如若转载，请注明出处：https://blog.ytso.com/1983.html