(转)Linux 文本对比 diff 命令详解(整理)

原文:https://www.shuzhiduo.com/A/1O5ErMybd7/

1.概述

windows系统下面就有不错的文本对比工具可以使用,例如常用的Beyond Compare,WinMerge都是图形界面的比较工具而且使用非常方便,如果你仅仅是在windows下工作,这些GUI的比较工具绝对是首选。对于在linux环境下工作的人来说,如果每次想看两个文件的区别都要将文件下载到windows环境然后用图形工具进行比较实在是太麻烦了。那么我们必须学会使用linux环境下的比较工具 diff。

diff命令在最简单的情况下,比较给定的两个文件的不同。如果使用“-”代替“文件”参数,则要比较的内容将来自标准输入。diff命令是以逐行的方式,比较文本文件的异同处。如果该命令指定进行目录的比较,则将会比较该目录中具有相同文件名的文件,而不会对其子目录文件进行任何比较操作。

语法

  1. diff(选项)(参数)

选项

  1. -<行数>:指定要显示多少行的文本。此参数必须与-c或-u参数一并使用;
  2. -a或——text:diff预设只会逐行比较文本文件;
  3. -b或--ignore-space-change:不检查空格字符的不同;
  4. -B或--ignore-blank-lines:不检查空白行;
  5. -c:显示全部内容,并标出不同之处;
  6. -C<行数>或--context<行数>:与执行“-c-<行数>”指令相同;
  7. -d或——minimal:使用不同的演算法,以小的单位来做比较;
  8. -D<巨集名称>或ifdef<巨集名称>:此参数的输出格式可用于前置处理器巨集;
  9. -e或——ed:此参数的输出格式可用于ed的script文件;
  10. -f或-forward-ed:输出的格式类似ed的script文件,但按照原来文件的顺序来显示不同处;
  11. -H或--speed-large-files:比较大文件时,可加快速度;
  12. -l<字符或字符串>或--ignore-matching-lines<字符或字符串>:若两个文件在某几行有所不同,而之际航同时都包含了选项中指定的字符或字符串,则不显示这两个文件的差异;
  13. -i或--ignore-case:不检查大小写的不同;
  14. -l或——paginate:将结果交由pr程序来分页;
  15. -n或——rcs:将比较结果以RCS的格式来显示;
  16. -N或--new-file:在比较目录时,若文件A仅出现在某个目录中,预设会显示:Only in目录,文件A 若使用-N参数,则diff会将文件A 与一个空白的文件比较;
  17. -p:若比较的文件为C语言的程序码文件时,显示差异所在的函数名称;
  18. -P或--unidirectional-new-file:与-N类似,但只有当第二个目录包含了第一个目录所没有的文件时,才会将这个文件与空白的文件做比较;
  19. -q或--brief:仅显示有无差异,不显示详细的信息;
  20. -r或——recursive:比较子目录中的文件;
  21. -s或--report-identical-files:若没有发现任何差异,仍然显示信息;
  22. -S<文件>或--starting-file<文件>:在比较目录时,从指定的文件开始比较;
  23. -t或--expand-tabs:在输出时,将tab字符展开;
  24. -T或--initial-tab:在每行前面加上tab字符以便对齐;
  25. -u,-U<列数>或--unified=<列数>:以合并的方式来显示文件内容的不同;
  26. -v或——version:显示版本信息;
  27. -w或--ignore-all-space:忽略全部的空格字符;
  28. -W<宽度>或--width<宽度>:在使用-y参数时,指定栏宽;
  29. -x<文件名或目录>或--exclude<文件名或目录>:不比较选项中所指定的文件或目录;
  30. -X<文件>或--exclude-from<文件>;您可以将文件或目录类型存成文本文件,然后在=<文件>中指定此文本文件;
  31. -y或--side-by-side:以并列的方式显示文件的异同之处;
  32. --help:显示帮助;
  33. --left-column:在使用-y参数时,若两个文件某一行内容相同,则仅在左侧的栏位显示该行内容;
  34. --suppress-common-lines:在使用-y参数时,仅显示不同之处。

还有个colordiff命令,用颜色标识不同的地方。需要先安装

2.diff如何工作,如何理解diff的执行结果

diff分析两个文件,并输出两个文件的不同的行。diff的输出结果表明需要对一个文件做怎样的操作之后才能与第二个文件相匹配【或者这么理解:与第一个文件相比,第二个文件发生了那些变化】【git diff的结果输出也是如此】。diff并不会改变文件的内容,但是diff可以输出一个ed脚本来应用这些改变。
现在让我们来看一下diff是如何工作的,假设有两个文件:

//file1.txt
I need to buy apples.
I need to run the laundry.
I need to wash the dog.
I need to get the car detailed.

//file2.txt
I need to buy apples.
I need to do the laundry.
I need to wash the car.
I need to get the dog detailed.

我们使用diff比较他们的不同:
diff file1.txt file2.txt

输出如下结果:
2,4c2,4
< I need to run the laundry.
< I need to wash the dog.
< I need to get the car detailed.
---
> I need to do the laundry.
> I need to wash the car.
> I need to get the dog detailed.

我们来说明一下该输出结果的含义,要明白diff比较结果的含义,我们必须牢记一点,diff描述两个文件不同的方式是告诉我们怎么样改变第一个文件之后与第二个文件匹配。我们看看上面的比较结果中的第一行
2,4c2,4
前面的数字2,4表示第一个文件中的行,中间有一个字母c表示需要在第一个文件上做的操作(a=add,c=change,d=delete),后面的数字2,4表示第二个文件中的行。

 

2,4c2,4 的含义是:第一个文件中的第[2,4]行(注意这是一个闭合区间,包括第2行和第4行)需要做出修改才能与第二个文件中的[2,4]行相匹配。
接下来的内容则告诉我们需要修改的地方,前面带 < 的部分表示左边文件的第[2,4]行的内容,而带> 的部分表示右边文件的第[2,4]行的内容,中间的 --- 则是两个文件内容的分隔符号。

3.Normal模式

上面的部分我们说明了如何查看diff命令的结果,实际上对于上面的比较,我们使用的是diff命令的Normal模式,这也是diff命令的默认模式,也就是说diff两个文件的时候如果不加模式参数则是默认模式进行比较,其效果与(--normal)一样,我们举一些例子来说明Normal模式下的输出结果(前面已经说明了一种比较结果),为了直观查看两个文件的不同我在windows下面通过BeyondCompare工具列出两个文件的不同,而截图下面的黑色部分则是diff的比较输出截图。

第一个文件比第二个文件少了行的情况:

(转)Linux 文本对比 diff 命令详解(整理)

第一个文件比第二个文件多出行的情况:

(转)Linux 文本对比 diff 命令详解(整理)

第一个文件与第二个文件不相同的情况:

(转)Linux 文本对比 diff 命令详解(整理)

以上diff命令执行的时候没有指定额外的模式参数,所以其使用的是默认的Normal模式,效果与添加命令行参数--normal 是一样的。

4.Context模式

默认情况下的模式输出结果实际上是符合计算机的思维方式,不太直观,所以其输出结果并不能够很好的被人理解,diff命令除了默认模式之外还提供了另外两种模式,Context和Unified模式,本节我们说说如何查阅Context模式下的输出结果。diff命令应用Context模式只需要添加命令行参数
diff -c  即可,我们先看看两个案例文件:

(转)Linux 文本对比 diff 命令详解(整理)

接下来说明这两个文件以diff  -c 方式比较的结果:

(转)Linux 文本对比 diff 命令详解(整理)

 

5.Unified模式

diff还有一种比较方式,也即Unified模式,使用命令行 –u 来执行该模式的比较。其比较结果与Context模式很像,但是简化了一些输出,我们看看我们的案例文件,与上面的一样:

(转)Linux 文本对比 diff 命令详解(整理)

使用diff –u 比较的结果:

(转)Linux 文本对比 diff 命令详解(整理)

可以看到其比较结果与Context模式实际上差不多,只不过将比较结果合并到一起了。

 

6.比较目录

使用diff可以比较两个目录,其比较格式是  diff  directory1  directory2 查看如下目录比较结果:

(转)Linux 文本对比 diff 命令详解(整理)

比较两个目录的时候无非是有的文件仅仅存在于某个目录中而在另一个目录中没有,如果存在同名的文件,则比较这两个文件的不同。diff比较目录的结果我们可以结合grep命令筛选出我们想要的输出,例如仅仅输出两个目录下不同的文件而忽略掉某一个目录独有另一个目录不存在的输出记录。

 

7.参数 -e 将比较的结果保存成一个ed脚本,之后ed程序可以执行该脚本文件,从而将file1修改成与file2的内容相同,这一般在patch的时候有用。

diff  -e  1.txt  2.txt  > script.txt
这样就是生成了一个ed可以执行的脚本文件script.txt,生成脚本文件之后我们还需要做一个操作, 在脚本文件末尾添加ed的write指令,只需要执行 echo "w" >>script.txt 将w指令附加到脚本文件的最后一行即可。
那么如何应用该脚本文件呢,可以这样使用:
ed  -  1.txt < script.txt 
注意中间的 – 符号表示从标准输入中读取,而 < script.txt 则重定向script.txt的内容到标准输入。这样执行之后1.txt的内容将与2.txt完全相同。

上一篇:前缀和和差分


下一篇:Matlab求离散数据的一阶导