报错总结:
1. stack overflow。
1) 描述:
在Tops下面的具体分类下,例如tops1, tops2, tops3等, 我使用了线程池的方法,开了10个线程去爬取每一个页面中的具体不同tops的url.其中因为会匹配next page.然后,应为next page使用了嵌套函数。get_html中套用了当发现next page的时候,向next page的url发送request请求。因此出现嵌套层数太多,stack堆砌太多,报stack overflow错误。
2)解决方法:
重新运行或者减少线程数量。