python 根据中文构造url的方法

python 在处理网页的时候通常需要自己构造url,如在浏览器中显示为python 根据中文构造url的方法

实际浏览器载入的url是:

http://search.jd.com/Search?keyword=%E7%A7%BB%E5%8A%A8%E5%B8%A6%E5%BC%8F%E8%BE%93%E9%80%81%E6%9C%BA&enc=utf-8&book=y

这里涉及到url编码中文的问题


需要把中文转换为url编码,具体用到python urllib或者urllib2库,一下用urllib2实例

isn=raw_input(‘请输入关键字‘)

isn1=urllib2.quote(isn.decode(sys.stdin.encoding).encode(‘utf8‘))

url=‘http://search.jd.com/Search?keyword=‘+isn1+‘&enc=utf-8&suggest=0&book=y‘


具体红色部分用什么编码方式的具体分析,像京东的是utf8方式从url中也可以体现出来。百度的是gbk,其他的一般网站比如google就是utf8的。



参考链接:http://developer.51cto.com/art/201003/190800.htm



python 根据中文构造url的方法

上一篇:Python 学习笔记 (8)—— sys模块


下一篇:python unicode