目录
sed的介绍
- sed 是一个强大而简单的文本解析转换工具,可以读取文本,并根据指定的条件对文本内容进行编辑(删除、替换、添加、移动等),最后输出所有行或者仅输出处理的某些行。
- sed也可以在无交互的情况下实现相当复杂的文本处理操作,被广泛应用于shell脚本中,用以完成各种自动化处理任务。
sed的工作流程
sed 的工作流程主要包括读取、执行和显示三个过程。
- 读取:sed从输入流(文件、管道、标准输入)中读取一行内容并存储到临时的缓冲区中(又称模式空间,patternspace)。
- 执行:默认情况下,所有的sed命令都在模式空间中顺序地执行,除非指定了行的地址,否则sed命令将会在所有的行上依次执行。
- 显示:发送修改后的内容到输出流。在发送数据后,模式空间将会被清空。
在所有的文件内容都被处理完成之前,上述过程将重复执行,直至所有内容被处理完。
注意:默认情况下所有的sed命令都是在模式空间内执行的,因此输入的文件并不会发生任何变化,除非是用重定向存储输出。
sed工作原理
过程:
读入新的一行内容到缓存空间;
从指定的操作指令中取出第一条指令,判断是否匹配pattern;
如果不匹配,则忽略后读的编辑命令,回到第2步继续取出下一条指令;
如果匹配,则针对缓存的行执行后续的编辑命令;完成后,回到第2步继续取出下一条指令;
当所有指令都应用之后,输出缓存行的内容;回到第1步继续读入下一行内容;
当所有行都处理完之后,结束;
sed命令常见用法
通常情况下调用sed命令有两种格式,如下所示。
其中,"参数"是指操作的目标文件,当存在多个操作对象时用,文件之间用逗号" ,"分隔;而 scriptfile表示脚本文件,需要用"-f"选项指定,当脚本文件出现在目标文件之前时,表示通过指定的脚本文件来处理输入的目标文件。
语法结构
sed [选项] '操作' 参数
sed [选项] -f scriptfile 参数
常见的选项
-e 或 --expression= :表示用指定命令或者脚本来处理输入的文本文件。
-f 或 --file= :表示用指定的脚本文件来处理输入的文本文件。
-h 或 --help :显示帮助。
-n、--quiet 或 silent :表示仅显示处理后的结果。
-i.bak :直接编辑文本文件。
-r,-E :使用扩展正则表达式。
-s :将多个文件视为独立文件,而不是单个连续的长文件流。
常见的操作
"操作"用于指定对文件操作的动作行为,也就是sed的命令。通常情况下是采用的"[n1 [,n2] ]"操作参数的格式。n1、n2是可选的,代表选择进行操作的行数,如操作需要在5~20行之间进行,则表示为"5,20动作行为”。
a:增加,在当前行下面增加一行指定内容。
c:替换,将选定行替换为指定内容。
d:删除,删除选定的行。
i:插入,在选定行上面插入一行指定内容。
p:打印,如果同时指定行,表示打印指定行;如果不指定行,则表示打印所有内容;如果有非打印字符,则以ASCII 码输出。其通常与"一n"选项一起使用。
s:替换,替换指定字符。
y:字符转换。
sed用法示例
(1)输出符合条件的文本(p表示正常输出)
案列:
①输出所有内容,等同于cat lianxi.txt.txt。
②输出第3行。
③输出3~5行。
④输出所有奇数行,n表示读入下一行资料。
⑤输出所有偶数行,n表示读入下一行资料。
⑥输出第1~5行之间的奇数行(第1、3、5行)。
⑦输出第10 行至文件尾之间的偶数行。
在执行"sed -n '10,${n;p}' test.txt"命令时,读取的第1行是文件的第10行,读取的第2行是文件的第11行,依此类推,所以输出的偶数行是文件的第11行、13行直至文件结尾,其中包括空行。
⑧直接显示第二行内容。
sed命令结合正则表达式时,格式略有不同,正则表达式以"/"包围。
案例:
①输出包含the的行。
②输出从第4行至第一个包含the的行。
③输出包含the的行所在的行号,等号(=)用来输出行号。
④输出以PI开头的行。
⑤输出以数字结尾的行。
⑥输出包含单词wood的行,\<、\>代表单词边界。
(2)册除符合条件的文本(d)
命令的几种常用删除用法。
下面命令中nl命令用于计算文件的行数,结合该命令可以更加直观地查看到命令执行的结果。
①删除第3行。
②删除3~5行。
③删除包含cross 的行。(原本的第8行被删除;如果要删除不包含cross 的行,用!符号表示取反操作,如'/cross/!d')。
④删除以小写字母开头的行。
⑤删除以"."结尾的行。
⑥删除所有空行。
(3)替换符合条件的文本
在使用sed命令进行替换操作时需要用到s(字符串替换)、c(整行/整块替换)、y(字符转换)命令选项,常见的用法如下所示。
①将每行中的第一个the替换为THE。
sed 's/the/THE/' lianxi.txt.txt
②将每行中的第2个l替换为L。
sed 's/l/L/2' lianxi.txt.txt
③将文件中的所有the 替换为THE。
sed 's/the/THE/g' lianxi.txt.txt
④将文件中的所有o删除(替换为空串)。
sed 's/o//g' lianxi.txt.txt
⑤在每行行首插入#号。
⑥在包含the 的每行行首插入#号。
⑦在每行行尾插入字符串EOF。
⑧将第3~5 行中的所有the替换为THE。
⑨将包含the 的所有行中的o都替换为0。
⑩用sed修改/etc/sysconfig/selinux 文件中的增强功能。
sed -i.bak 's/SELINUX=disabled/SELINUX=enable/' /etc/sysconfig/selinux
(4)迁移符合条件的文本
在使用sed命令迁移符合条件的文本时,常用到以下参数:
H:复制到剪贴板;
g、G:将剪贴板中的数据覆盖/追加至指定行;
w:保存为文件;
r:读取指定文件;
a:追加指定内容。具体操作方法如下所示。
I,i:忽略大小写。
①将包含the 的行迁移至文件末尾,{;}用于多个操作。
②将第1~5行内容转移至第17行后。
sed '1,5{H;d};17G' lianxi.txt.txt
③将包含the 的行另存为文件out.file。
sed '/the/w out.file' lianxi.txt.txt
④将文件/etc/hostname的内容添加到包含1的每行以后。
⑤在第3行后插入一个新行,内容为New。
⑥在包含1的每行后插入一个新行,内容为New。
⑦在第3行后插入多行内容,中间的\n表示换行。
(5)使用脚本编辑文件
案列:
使用sed将多个编辑指令存放到文件中(每行一条编辑指令),通过"-f"选项来调用。例如执行以下命令即可将第1~5行内容转移至第16行后。
sed方法:
sed '1,5{H;d};16G' test.txt //将第1~5行内容转移至第16行后
脚本方法:
[root@localhost ~] # vim opt.list
1,5H
1,5d
16G
[root@localhost ~]# sed -f opt.list test.txt
(6)sed直接操作文件
案例:
编写一个脚本,用来调整vsftpd 服务配置,要求禁止匿名用户,但允许本地用户(也允许写入)。
[root@localhost ~]#vim local_only_ftp.sh
#!/bin/bash
#指定样本文件路径、配置文件路径
SAMPLE="/usr/share/doc/vsftpd-3.0.2/EXAMPLE/INTERNET_STTE/vsftpd.conf"
CONFIG="/etc/vsftpd/vsftpd.conf"
#备份原来的配置文件,检测文件名为/etc/vsftpd/vsftpd.conf.bak备份文件是否存在,若不存在则使用cp命令进行文件备份
[ ! -e "SCONFIG.bak" ] && cp $CONFIG $CONFIG.bak
#基于样本配置进行调整,覆盖现有文件
sed -e '/^anonymous_enable/s/YES/NO/g' $SAMPLE >$CONFIG
sed -i -e '/^local_enable/s/NO/YES/g' -e '/^write_enable/s/NO/YES/g' $CONFIG
grep "listen" $CONFIG || sed -i '$alisten=YES' $CONFIG
#启动vsftpd 服务,并设为开机后自动运行
systemctl restart vsftpd
systemctl enable vsftpd
[root@localhost ~] #chmod +x local_only_ftp.sh