google diff python API 使用

本文介绍如何使用Googlediff库进行文本比较,包括安装、配置及使用方法。Googlediff能有效比较同一或不同用户的不同版本文本,支持多种语言,尤其适用于实验室网站上的文本差异展示。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

因实验室的网站上需要对同一个或不同用户的不同版本的文本进行比较,用到了google diff这个工具。
google diff 网址:https://code.google.com/p/google-diff-match-patch/
源码包才300k+,下载下来,发现其支持很多语言。
笔者使用了python2。
一般API的使用可以看test文件,依葫芦画瓢。
在工程的__init__.py中加入
from .diff_match_patch import diff_match_patch, patch_obj


在要用到google diff的py文件中加入
import diff_match_patch as dmp_module


在函数块里

self.dmp = dmp_module.diff_match_patch()


#然后就可以使用self.dmp调用各个函数了

cmpstr = self.dmp.diff_main("txt", "test")
#建议加上下面两行,效果好很多
self.dmp.diff_cleanupSemantic(cmpstr)
self.dmp.diff_cleanupEfficiency(cmpstr)
ret = self.dmp.diff_prettyHtml(cmpstr)


笔者对比了一下,英文和英文,英文和中文效果都还不错,中文和中文有时候会出现一点问题。



“但”和“上”有什么问题?



 后来证明还是中文编码的问题,修正一下是可以比较中文,并不会出现乱码。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值