这是我的第一个爬虫,仿照CSDN的一位博主文章,并加以改进,能获取到电影名,电影别名.
#coding=utf-8
import sys
import io
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
from bs4 import BeautifulSoup
import requests
req_obj = requests.get('https://movie.douban.com/chart')
bsobj = BeautifulSoup(req_obj.text,'lxml')
div = bsobj.find_all('div',class_='pl2')
for item in div:
movie_name = item.a.get_text().strip().replace("\n","").replace("\r","").replace("\t","").replace(" ","")
print(movie_name)
结果:
绿皮书/绿簿旅友(港)/幸福绿皮书(台)
我们/我们·异(港)
行骗天下:运势篇/信用诈欺师JP:运势篇
风中有朵雨做的云/地狱恋人/地狱情人
比悲伤更悲伤的故事/MoreThanBlue
疾速备战/疾速追杀3/疾速逃亡
驯龙高手3/驯龙记3(港)/驯龙高手3:隐秘的世界
如影随心/可遇可求/Lostinlove
撞死了一只羊/Jinpa
过春天/分隔线/佩佩