String Decode方法
功能描述
decode方法对使用编码的字符串进行解码。
语法
Str.decode(encoding='UTF-8',errors='strict')
参数
- encoding:使用的编码
- errors:设置不同的错误处理方案。默认值是’strict’,表示编码的错误将引发UnicodeError。其他可能的值是’ignore’, ‘replace’, ‘xmlcharrefreplace’, 'backslashreplace’和其他通过codecs.register_error()注册的名称。
返回值
解码的字符串
示例
Str = "你好"
Str = Str.encode('utf-8','strict')
print("Encoded String: ",Str)
print("Decoded String: " + Str.decode('utf-8','strict'))
执行结果
Encoded String: b'\xe4\xbd\xa0\xe5\xa5\xbd'
Decoded String: 你好
如果编码与解码方式不一样,且更改错误码后
print("Decoded String: " + Str.decode('gb2312','ignore'))
print("Decoded String: " + Str.decode('gb2312','replace'))
print("Decoded String: " + Str.decode('gb2312','backslashreplace'))
print("Decoded String: " + Str.decode('gb2312','xmlcharrefreplace'))
执行结果
Decoded String: 浣濂
Decoded String: 浣�濂�
Decoded String: 浣\xa0濂\xbd
TypeError: decoding with 'gb2312' codec failed (TypeError: don't know how to handle UnicodeDecodeError in error callback)
Error的处理机制
- ignore:忽略错误解析的数据,编码或解码将继续,且不通报;
- replace:将编码错误替换为?;将解码错误替换为�
- backslashreplace:将格式错误数据替换为反斜线转义序列
- xmlcharrefreplace:不可替换的字符由适当的XML字符引用替换