diff文件的格式

diff
参考[url]http://en.wikipedia.org/wiki/Diff[/url]
diff是一个比较工具,它比较两个文件,然后输出两个文件的差异,这个差异文件叫做diff文件。它通常被用来找出同一文件两个版本之间的差异。所谓差异,就是指从原文件到新文件增加了哪些,删除了哪些。

diff的算法
实现diff功能的算法基础是最长公共子序列 longest common subsequence problem[url]http://en.wikipedia.org/wiki/Longest_common_subsequence_problem[/url].
中文解释见[url]http://hxraid.iteye.com/blog/622462[/url]
例如下面两个串
S1: a b c d f g h j q z
S2: a b c d e f g i j k r x y z
根据LCS算法(这个算法貌似很复杂,这里略掉了),得到其最长公共子序列(LCS)是:
LCS: a b c d f g j z
示意图如下:
[img]http://dl.iteye.com/upload/attachment/278343/25e80ed1-bde3-30f2-a924-cf7918d8e0a8.png[/img]
(这个示意图是不严谨的,因为LCS是有顺序的,而集合却没有顺序性)

根据这个序列,就可以得到S2串和S1串间的差异:
如果某个字符S1中有,LCS中没有,表示S2中删除了这个字符,如上图的‘h’;
如果S2中有,而LCS中没有,则表示S2中增加了这个字符,如上图的“e,I,k,r,x,y”。
其结果如下:
e h i q k r x y
+ - + - + + + +
这个结果就是diff比较后输出的差异文件。

这里diff的是字符串,实际的diff以"行"为单位来比较两个文本文件的。


如何读diff文件格式:

diff文件格式有列举模式,命令模式和上下文模式。

命令模式表示从原文件到新文件需要执行哪些命令才能实现。命令主要就是add,change,del。
命令模式可能主要便于程序自动执行的,人不太好读。

上下文模式则是由区块(chunk)组成的,区块列举原文件和新文件中有不同的地方,因为有上下文,所以更便于阅读。

看上下文模式的:

比如如下两个文件:
[img]http://dl.iteye.com/upload/attachment/278345/abd71c99-b99f-3ee7-8d6c-df44be6c329a.png[/img]

其diff的结果文件,上下文格式如下(部分结果):
[img]http://dl.iteye.com/upload/attachment/278347/7fdabaea-2baa-3194-a976-f5dda0ccc9df.png[/img]

最开始的两行表示了这个diff文件是哪两个文件间的差异。
@@表示一个区块的开始,这个区块到下一个“@@”为止。


@@ -1,3 +1,9 @@
+This is an important
+notice! It should
+therefore be located at
+the beginning of this
+document!
+
This part of the
document has stayed the
same from version to
-1,3表示原文件的第1行到第3行间;
+1,9表示新文件的第1行到第9行
第3行和第9行,这两个行数不同,表示从源文件到新文件增加了几行。
带加号(+)的行,表示增加的,不带号的,表示原来就有的;

@@ -5,16 +11,10 @@
be shown if it doesn't
change. Otherwise, that
would not be helping to
-compress the size of the
-changes.
-
-This paragraph contains
-text that is outdated.
-It will be deleted in the
-near future.
+compress anything.

It is important to spell
-check this dokument. On
+check this document. On

带减号(-)的,表示删除了这几行。
其余同上。

介绍完毕。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值