grep
正则表达式规则: ^     行首定位符,表示从行首开始进行模式匹配
.     一个非换行符的字符
[ ]    匹配属于此集合的任意一个字符
[^ ]    匹配不属于此集合的任意一个字符
[a-z]   (其指定的集合包含从a到z的所有小写字母,)
\     转义控制符,用来转义元字符或者转义普通字符
\(...\) 标记此模式为一个分组
\<    单词首位定位符,单词的定义为: [A-Za-z0-9_]+
\>    单词末尾定位符
x\{m\} 字符x重复匹配m次
x\{m,\} 字符x至少重复匹配m次,贪婪匹配原则
x\{m,n\} 字符x重复匹配m次至n次,贪婪匹配原则
*     等价于 \{,\}
\|    匹配条件或
$     行尾定位符

练习:写一个正则表达式模式可用来匹配标准ipv4地址,形如0-255.0-255.0-255.0-255

解:

-255可分解如下:
-   [-]
-  [-][-]
- [-]{}
- [-][-]
- [-]

使用'或'合并得到:

\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)

整理,易得:

\<\(\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)\.\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)\.\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)\.\([-]\|[-][-]\|[-]\{\}\|[-][-]\|[-]\)\)\>

运行结果:

正则表达式RE与扩展正则表达式ERE——grep与egrep-LMLPHP

egrep
扩展正则表达式规则: ^     行首定位符,表示从行首开始进行模式匹配
.     一个非换行符的字符
[ ]    匹配属于此集合的任意一个字符
[^ ]   匹配不属于此集合的任意一个字符
[a-z] (其指定的集合包含从a到z的所有小写字母,)
\     转义控制符,用来转义元字符或者转义普通字符
(...)   标记此模式为一个分组
\<     单词首位定位符,单词的定义为: [A-Za-z0-9_]+
\>     单词末尾定位符
x{m}   字符x重复匹配m次
x{m,} 字符x至少重复匹配m次,贪婪匹配原则
x{m,n} 字符x重复匹配m次至n次,贪婪匹配原则
*     等价于 {,}
?     等价于 {,}
+     等价于 {,}
|     匹配条件或
$     行尾定位符

由此易看出,扩展正则表达式与正则表达式之间的根本区别为,其增大了元字符的集合范围,增加的元字符有:

+ ? | { } ( )

这使得模式表现的更加简洁。

练习:写一个扩展正则表达式模式可用来匹配标准ipv4地址,形如0-255.0-255.0-255.0-255
解:

0-255可分解如下:
0-   [-]
-  [-][-]
- [-]{}
- [-][-]
- [-]

使用'或'合并得到:

([-]|[-][-]|[-]{}|[-][-]|[-])

整理,易得:

\<(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]))\>

运行结果:

正则表达式RE与扩展正则表达式ERE——grep与egrep-LMLPHP

附录:

//grep options
-?
  同时显示匹配行上下的?行,如:grep - pattern filename同时显示匹配行的上下2行。
-b,--byte-offset
  打印匹配行前面打印该行所在的块号码。
-c,--count
  只打印匹配的行数,不显示匹配的内容。
-f File,--file=File
  从文件中提取模板。空文件中包含0个模板,所以什么都不匹配。
-h,--no-filename
  当搜索多个文件时,不显示匹配文件名前缀。
-i,--ignore-case
  忽略大小写差别。
-q,--quiet
  取消显示,只返回退出状态。0则表示找到了匹配的行。
-l,--files-with-matches
  打印匹配模板的文件清单。
-L,--files-without-match
  打印不匹配模板的文件清单。
-n,--line-number
  在匹配的行前面打印行号。
-s,--silent
  不显示关于不存在或者无法读取文件的错误信息。
-v,--revert-match
  反检索,只显示不匹配的行。
-w,--word-regexp
  如果被\<和\>引用,就把表达式做为一个单词搜索。
05-27 19:07