一 正则表达式
1 简单的说正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表达式通过一些特殊符号的辅助,可以让用户轻易的达到查找,删除,替换某特定字符串的处理程序
2 grep在数据中查找一个字符串时,是以整行为单位来进行数据的选取的,也就是说假如一个文件内有10行,那么其中两行是有用的,那么就将这两行显示出来,其它的丢弃
3 在bash当中,我们知道通配符*可以用来表示任意个字符,但是正则表达式中的*表示不同的含义
在正则表达式中,'.'表示的是一定有一个任意字符的意思
在正则表达式中,'*'表示的是重复前一个字符0到无穷多次的意思
4 基础的正则表达式
RE字符 意义
^word 查找行首为word的行
word$ 查找结尾为word的行
. 代表一定有一个任意的字符
\ 转义字符,将特殊字符的特殊意义去除
* 重复前一个字符0个到无穷多个
[list] 从字符集合里面选择一个字符
[n1-n2] 从要选择的范围里面选择一个字符
[^list] 从不是这个字符集合里面找出一个字符
\{n,m\} 连续n到m个的前一个字符,\{n\}则是连续n个前一个字符,\{n,\}则是联系n到无穷多个前一个字符
二 sed 工具
1 sed本省是一个管道命令,可以分析标转输入,而且sed还可以将数据进行替换,删除,新增,选取特定行等功能
2 sed的用法
sed [-nefr] [动作]
-n 使用安静模式,在一般模式中,所有来自stdin的数据一般都会被列出到屏幕上,但是如果加上-n这个参数的话,则只有经过sed特殊处理的那一行才会被列出
-e 直接在命令模式上进行sed的动作编辑
-f 直接将sed的动作写在一个文件内,-f filename则可以执行filename内的sed动作
-r sed的动作支持的是扩展正则表达式的语法
-i 直接修改文件的内容,而不是由屏幕输出
3 动作说明 n1,n2 function
n1,n2不见得会存在,一般代表的是进行的动作的行数
function有下面这些参数
a: 新增,a的后面可以接字符串,而这些字符串会在新的一行出现,目前的下一行
c: 替换,c的后面可以接字符串,这些字符串可以替换n1,n2之间的行
d: 删除,因为是删除,所以d后面通常不接任何参数
i: 插入,i的后面可以接字符串,而这些字符串会在新的一行,目前的上一行
p: 打印,也就是将某个选择的数据打印出来
s: 替换,可以直接进行替换的工作
三 文件的格式化以及相关处理
1 格式化打印
printf '打印内容‘ 实际内容
关于C程序语言内,常见的变量格式
%ns 那个n是数字,s代表的是string
%nd 那个n是数字,d代表的是整数
%N.nf 那个n与N都是数字,f代表浮点数
2 文件比较工具diff
diff就是用在比较两个文件之间的区别,并且是行为单位来比较的,一般是用在ASCLL纯文本文件的比较上
diff的用法
diff [-bBi] from_file to_file
-b 忽略一行当中仅有多个空白的区别
-B 忽略空白行的区别
-i 忽略大小写的不同
3 如果我们要将旧的文件升级成为新的文件时,我们可以先利用diff比较出文件的区别,并将区别文件制作成为补丁文件,再由补丁文件更新旧文件即可。
一般来说我们使用diff制作出来的比较文件通常扩展名为.patch
更新:patch -pN < patch_file
还原:patch -R -pN < patch_file
举例: diff file1 file2 > diff.patch //得到补丁文件diff.patch
patch file1 < diff.patch //为file1打补丁