# 使用urllib来获取百度首页的源码
import urllib.request
# (1)定义一个url 就是你要访问的地址
url = 'http://www.baidu.com'
# (2)模拟浏览器向服务器发送请求 response响应
response = urllib.request.urlopen(url)
# (3)获取响应中的页面的源码 content 内容的意思
# read方法 返回的是字节形式的二进制数据
# 我们要将二进制的数据转换为字符串
# 二进制--》字符串 解码 decode('编码的格式')
content = response.read().decode('utf-8')
# (4)打印数据
print(content)
相关文章
- 10-07【网络爬虫】网站数据的简单爬取(2021-03-05)
- 10-07如何爬取翻页url不变的网站!你不变我就爬不了吗?
- 10-07爬虫学习:爬取一个网站的风景图片
- 10-07python 爬虫 网站的历史数据的爬取案例 API请求历史数据
- 10-07【爬虫】如何爬取某一知乎用户的所有回答?(一)
- 10-07双十一刚过,写了一个selenium爬取淘宝商品信息的爬虫
- 10-07如何利用Python网络爬虫爬取微信朋友圈动态--附代码(下)
- 10-07python爬虫多进程,多线程,协程以及组合应用的效率对比--以爬取小说全文为例
- 10-07python爬虫24 | 搞事情了,用 Appium 爬取你的微信朋友圈。
- 10-0724、Python快速开发分布式搜索引擎Scrapy精讲—爬虫和反爬的对抗过程以及策略—scrapy架构源码分析图