我正在使用difflib.HtmlDiff
类,但使用两组文本(来自网站的HTML)调用该函数,但是当它创建表时
html_diff = difflib.HtmlDiff()
print html_diff.make_table(previous_contents, fetch_url.page_contents)
但是,这似乎只是按字符比较字符(每个表行1个字符),最后我得到了一个4.3MB的txt文件,用于两套仅100k的html.
doc文件说,
Compares fromlines and tolines (lists of strings) and returns a string which is a
complete HTML file containing a table showing line by line differences with
inter-line and intra-line changes highlighted.
但是,事实并非如此.
有什么建议么?
解决方法:
您提供的是字符串,而不是字符串(行)列表.
假设UNIX或Windows行结束:
print html_diff.make_table(previous_contents.split('\n'),
fetch_url.page_contents.split('\n'))