一、初来乍到-体验
安装scrapy
pip install scrapy
安装 twisted依赖
pip install pywin32
尽量下载和电脑一样的操作系统65win64
下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
安装 wheel
pip install wheel
1.创建scrapy项目
命令行
scrapy startproject ershouche
2.创建scrapy爬虫项目
创建之前进入scrapy项目目录
cd ershouche
命令行
scrapy genspider cars www.che168.com
创建后在spider目录下有个叫cars的文件的爬虫
#注意这里要替换掉成要爬取的网址
start_urls = [‘https://www.che168.com/china/fengtian/#pvareaid=108402#listfilterstart’]
def parse(self, response):
print(‘数据抓回来了’)
print(response.status)
print(‘数据解析玩成’)
命令行运行代码
scrapy crawl cars
打印关键字 日志过滤
scrapy crawl cars -L ERROR
数据抓回来了
200
数据解析玩成
改下爬虫
scrapy genspider news www.che168.com