text =file.readlines() # 结果为str类型 for line in text:#遍历文件 print("开始爬取评论") name = line.split()[0]
加了个功能自动遍历网址目录进行爬取
然后接下来就是多爬取数据,然后进行数据清洗,清洗部分不符合格式要求的数据
最后分析可视化等等
2023-09-29 19:58:52
text =file.readlines() # 结果为str类型 for line in text:#遍历文件 print("开始爬取评论") name = line.split()[0]
加了个功能自动遍历网址目录进行爬取
然后接下来就是多爬取数据,然后进行数据清洗,清洗部分不符合格式要求的数据
最后分析可视化等等