python全栈开发-Day7 字符编码总结

python全栈开发-Day7 字符编码总结

一、字符编码总结

1、什么是字符编码  

  人类的字符---------》翻译---------》数字
  翻译的过程遵循的标准即字符编码(就是一个字符与数字一一对应关系的表)

   我们在计算机上常见:
    ascii   英文:1bytes
    gbk:中文:2bytes 英文:1bytes
    unicode:任意字符:2bytes
    utf-8:中文:3bytes,英文1bytes

2、字符编码要掌握的知识点  

  1、以什么编码存的,就应该以该编码取

    #coding:utf-8 :用于python解释器读取python文件,所以文件头指定的编码必须跟python文件存储时用的编码一致

  2、 编码解码
    unicode---编码encode---》utf-8
    utf-8---解码decode---》unicode
    python3中str是以unicode编码形式存放的
    x='你好'
    x.encode('utf-8') ----> bytes
    bytes.decode('utf-8')------------->str(unicode)

    上面最核心的一点就是不管什么(ps:不是官方认证不算)编码都能够去解码成unicode,如果我们遇到乱码问题,

找它是以什么编码格式存在硬盘中。

  3、bytes类型的用途:
    1、存放到文件中(说白了就是文件的处理,不需要复杂的解码的过程,直接进行移动存储)

      具体的操作看文件操作这篇博客!

    2、基于网络传输(后面的网络编程会有相应的博客,还没学到敬请期待!)

  

上一篇:linux下google chrome浏览器字体修改


下一篇:python基础_字符编码