首先得到的数据分为两列,两种类型。由于在网站上搜索的时候,网站的"特殊性"会将000638-32-4 前面的0全部去掉。变成了638-32-4。基于得到了两列稍有不同的数据。由于人工看太费时间和脑力。所有首先用Python编写一个程序,将前面的0全部去掉。代码如下:
data = open('40000xxlist1.txt','a') with open('40000xxlist.txt') as f: lines = (line.lstrip('0') for line in f) for line in lines: data.write(line) data.close()
解析代码,其中lstrip(‘0’)的作用是将得到的字符串左边为0的部分删除。最后将数据存到另一个文件中。
下图是处理之前的:
下图是处理之后的:
将这两列数据拷贝到Excel中。所下所示:
结果:公式 =IF(A1=B1,"","1") 相同输出 空格,不同输出1 。这样就可以一目了然了。