python爬虫笔试题

1.python多线程jion()和setDaemon()?
2.写一个装饰器实例,并写出其实现原理(闭包),给出代码。
3.TCP和UDP的区别,三次握手四次挥手的过程。
4.使用python语言做网络爬虫时,在解析模块遇到的网页呈现方式及相关的解决方法涉及到的相关技术模块?以及在在下载模块用到的相关技术模块?
5.针对需要登录的网站,如何解决需要加密的参数?
6.scrapy如何去重,根据数据量从小到大的去重方式?
7.说说你对验证码的了解情况和解决思路?
8.请列举常见的防爬策略和相应的反爬策略?
9.pandas和numpy的区别?
10.scrapy框架的运行机制。

上一篇:.net简单的aspx创建


下一篇:Eclipse WebServiceExplorer