文本处理工具grepegrep和正则表达式的使用

1   详情

grepLinux系统中grepglobal serch regular expression and printout the line)是一种强大的文本搜索过滤工具,根据用户指定的模式对目标文本进行匹配检查,打印匹配到的行。表示全局正则表达式版本,它的使用权限是所有用户。

egrep: 用于在文件内查找指定的字符串。egrep 执行效果与grep相似,使用的语法及参数可参照grep最大的区别在与解读字符串的的方法egrep是用extended regular expression来解读的。也就是说他本来就是扩展的正则表达式,所以更加的规范简单方便。

2   常用命令

grep:

--color=auto 将匹配的结果着色显示

-B# 显示关键字行及向前#

-v 反向匹配

-C# 显示关键字向前#行,当前行,及向后#

-E 使用扩展正则表达式或egrep

-e 关键字1 -e 关键字实现多个选项间的逻辑or关系

-n 显示的结果前增加行号

-w 匹配整个单词

-c 仅显示匹配到结果的行数

--i 忽略大小写

-o 仅显示匹配到的字符串

-F 不使用正则表达式或 fgrep

-q 静默模式,不输出任何信息

或者&> /dev/null

-A# 显示关键字行及向后#

egrep:=grep –E 用法和grep差不多就是更加简单方便。一般数表示不需要\,除去\<\>\b\b

正则表达式

. 匹配任意单个字符

[] 匹配指定范围内的任意单个字符

[^] 匹配指定范围外的任意单个字符

[:alnum:] [0-9a-zA-Z]

[:alpha:] [a-zA-Z]

[:upper:] [A-Z]

[:lower:] [a-z]

[:blank:] 空白字符(空格和制表符)

[:space:] 水平和垂直的空白字符(比[:blank:]包含的范围广)

[:cntrl:] 不可打印的控制字符(退格、删除、警铃...

[:digit:] 十进制数字或[0-9]

[:xdigit:]十六进制数字

[:graph:] 可打印的非空白字符

[:print:] 可打印字符

[:punct:] 标点符号

3习题解读:

1显示/proc/meminfo文件中以大小s开头的行(要求使用两种方法)。

cat/proc/meminfo|grep -e ^s -e ^S

cat/proc/meminfo|grep "^s\|^S"

cat/proc/meminfo|grep "^[s\|S]"

cat/proc/meminfo|grep "^[Ss]"

cat/proc/meminfo|grep -i "^s"

wKioL1l8bdXQIOMCAABpegliuS8461.png

2显示/etc/passwd文件中不以/bin/bash结尾的行。

3显示用户rpc默认的shell程序。

4、找出/etc/passwd中的两位或三位数。

5、显示CentOS7/etc/grub2.cfg文件中,至少以一个空白

字符开头的且后面存非空白字符的行。

6、找出“netstat -tan”命令的结果中以‘LISTEN’后跟任意多个空白字符结尾的行。

7、显示CentOS7上所有系统用户的用户名和UID(两种)。

8、添加用户bashtestbashbashershnologin(shell

/sbin/nologin),找出/etc/passwd用户名同shell名的行。

9、仅利用dfgrepsort,取出磁盘各分区利用率,并从大到小排序。

10、显示三个用户rootmagewangUID和默认shell。

11、找出/etc/rc.d/init.d/functions文件中行首为某单词(包括下划线)后面跟一个小括号的行。

12、使用egrep取出/etc/rc.d/init.d/functions中其基名。

13、使用egrep取出上面路径的目录名。

14、统计last命令中以root登录的每个主机IP地址登录次数

15、利用扩展正则表达式分别表示0-910-99100-199200-249250-255

16、显示ifconfig命令结果中所有IPv4地址。

17、将此字符串:welcome to magedu linux 中的每个字符去重并排序,重复次数多的排到前面。