url编码分两种, 一种是unicode, 另一种是gb2312, 今天遇到的一个网站是要将字符编码按照gb2312来编码,用来得到一个先填写blanks后再返回页面的数据,废话少说,需要做的就是先查看你的python的编码是啥,默认是ascii,
1
2
3
|
import
sys
print
sys.getdefaultencoding()
# ‘ascii‘ |
直接附代码吧:
1
|
import
urllib as com
|
1
2
3
4
5
6
7
8
9
10
11
12
13
|
import
sys
reload (sys)
sys.setdefaultencoding( ‘utf-8‘ )
line =
"嘉定校区"
newline =
line.decode( "gb2312" )
para =
{ "data" :newline}
encoded_string =
com.urlencode(para)
#这样就可以把字符编码编成GB2312了并且成功得到网站回复 |