使用difflib.HtmlDiff类-显示单个字符

我正在使用difflib.HtmlDiff类,但使用两组文本(来自网站的HTML)调用该函数,但是当它创建表时

html_diff = difflib.HtmlDiff()
print html_diff.make_table(previous_contents, fetch_url.page_contents)

但是,这似乎只是按字符比较字符(每个表行1个字符),最后我得到了一个4.3MB的txt文件,用于两套仅100k的html.

doc文件说,

Compares fromlines and tolines (lists of strings) and returns a string which is a 
complete HTML file containing a table showing line by line differences with 
inter-line and intra-line changes highlighted.

但是,事实并非如此.

有什么建议么?

解决方法:

您提供的是字符串,而不是字符串(行)列表.

假设UNIX或Windows行结束:

print html_diff.make_table(previous_contents.split('\n'),
                           fetch_url.page_contents.split('\n'))
上一篇:通过difflib modul比较python中的列表


下一篇:Python 字符串相似性的几种度量方法