在做爬虫的时候,有时候需要爬写中文的内容。但是中文字符在某些场合下会转为 %xx 形式的 URL 字符。
比如:
%E7%BE%8E%E5%A5%B3
以上编码表示“美女”。
Python3 的 urllib 库,就可以对中文进行 URL编码和解码。
import urllib.parse
cn = input("请输入中文:")
bfb = urllib.parse.quote(cn) # 转为 url 编码
print( bfb )
print( urllib.parse.unquote(bfb) ) # 解码