python编码相关

1、1bit就是一个二进制位, 1或0
8bit = 1Byte(1字节) = 1个数字[-128~127] = 一个字母 = 0.5个汉字
int = 4Byte
char = 1Byte char* = 4Byte

2、Ascii code 是1个字节, unicode 是2个, 非常生僻的是4个

3、utf-8 可变长编码,合理分配1-6个字节,节省空间又不乱码

4、

ord('A') = 65
chr(65) = A

5、%-10.2f 左对齐,占10个位符,保留2位小数点

6、sys.argv 为脚本后面带的参数名list, sys.argv[0]为脚本自身名字

7、变量被频繁访问,所以存储在stack栈内存中

8、encode编码 ,decode解码

str.decode('gb2313')    # 将gb2313编码的str解码为unicode
str.encode('gb2313')    # 将unicode编码的str转成gb2313编码,unicode相当于中间媒介

9、报错:UnicodeDecodeError:'ascii' codec can't decode byte.....解觉如下

import sys
reload(sys)
sys.setdefaultencoding('utf-8')

10、'chcp'在cmd中查看code编码设置, 'chcp 65001' 设为utf-8

上一篇:凯撒密码


下一篇:爬取全部穿越火线武器的图片以武器名称命名保存到本地文件