Python学习笔记15:URL中的中文编码转换

在做爬虫的时候,有时候需要爬写中文的内容。但是中文字符在某些场合下会转为 %xx 形式的 URL 字符。

比如:

%E7%BE%8E%E5%A5%B3

以上编码表示“美女”。

Python3 的 urllib 库,就可以对中文进行 URL编码和解码。

import urllib.parse

cn = input("请输入中文:")
bfb = urllib.parse.quote(cn)   # 转为 url 编码
print( bfb )
print( urllib.parse.unquote(bfb) )  # 解码

 

上一篇:node中的url模块


下一篇:Python3的urllib.parse常用函数小结(urlencode,quote,quote_plus,unquote,unquote_plus等)