Python之使用代理服务器访问网页

使用同一个ip频繁爬取一个网站,久了之后会被该网站的服务器屏蔽。所以这个时候需要使用代理服务器。通过ip欺骗的方式去爬取网站

from urllib import request
# 也可以from urllib.request as request
def use_porxy(porxy_addr,url): 
  porxy = request.ProxyHandler({'http':porxy_addr})    
  opener = request.build_opener(porxy, request.ProxyHandler)   request.install_opener(opener)   
  try:
      response = request.urlopen(url, timeout=5)
  except Exception as e:
      print('交接错误,退出程序')
      exit()
  data = response.read().decode('utf-8')    
  return data
  
data = use_porxy("114.115.182.59:128","http://www.baidu.com")
print(len(data)
上一篇:看了下opengl相关的资料,踩了一个坑,记录一下


下一篇:c/c++ 输人一个字符串, 内有数字和非数字字符, 如al23x456 17960?302tab5876将其中连续的数字作为一个整数, 依次存放到一数组a中 例如, 123放在a[o], 456放在