2021-01-12

1、TimeoutError: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败

解决方法:
req = requests.get(url, headers=headers, proxies=proxies, timeout=5)

如上,在request.get()函数中加个timeout参数就行了,下面详细介绍下该参数。

timeout 是用作设置响应时间(单位:秒)的,可以设置一个float或者一个tuple参数,响应时间分为连接时间和读取时间,timeout(3,7)表示的连接时间是3秒,响应时间是7秒。

超时(timeout)

为防止服务器不能及时响应,大部分发至外部服务器的请求都应该带着 timeout 参数。在默认情况下,除非显式指定了 timeout 值,requests 是不会自动进行超时处理的。如果没有 timeout,你的代码可能会挂起若干分钟甚至更长时间。

连接超时指的是在你的客户端实现到远端机器端口的连接时(对应的是 connect() ),Request 会等待的秒数。一个很好的实践方法是把连接超时设为比 3 的倍数略大的一个数值,因为 TCP 数据包重传窗口 (TCP packet retransmission window) 的默认大小是 3。
通常的处理是在requests.get()语句中加入timeout限制请求时间
req = requests.get(url, headers=headers, proxies=proxies, timeout=5)
上一篇:python爬虫必备知识点, 代理请求数据


下一篇:爬虫小插曲:关于代理参数-proxies那些事