python全栈开发-Day7 字符编码总结
一、字符编码总结
1、什么是字符编码
人类的字符---------》翻译---------》数字
翻译的过程遵循的标准即字符编码(就是一个字符与数字一一对应关系的表)
我们在计算机上常见:
ascii 英文:1bytes
gbk:中文:2bytes 英文:1bytes
unicode:任意字符:2bytes
utf-8:中文:3bytes,英文1bytes
2、字符编码要掌握的知识点
1、以什么编码存的,就应该以该编码取
#coding:utf-8 :用于python解释器读取python文件,所以文件头指定的编码必须跟python文件存储时用的编码一致
2、 编码解码
unicode---编码encode---》utf-8
utf-8---解码decode---》unicode
python3中str是以unicode编码形式存放的
x='你好'
x.encode('utf-8') ----> bytes
bytes.decode('utf-8')------------->str(unicode)
上面最核心的一点就是不管什么(ps:不是官方认证不算)编码都能够去解码成unicode,如果我们遇到乱码问题,
找它是以什么编码格式存在硬盘中。
3、bytes类型的用途:
1、存放到文件中(说白了就是文件的处理,不需要复杂的解码的过程,直接进行移动存储)
具体的操作看文件操作这篇博客!
2、基于网络传输(后面的网络编程会有相应的博客,还没学到敬请期待!)