Python的语法采用缩进的方式,一般使用四个空格,并且是大小写敏感的
字符编码
计算机只能处理数字,如果要处理文本,必须先把文本转换成数字才能处理
采用8个比特(bit)作为一个字节(byte)
一个字节能表示的最大的整数是255(二进制11111111=十进制255)
把127个字母字符编码成一张ASCII编码,一个字符就一个字节,例如:A是65
把英文字母和其他语言编码成一张Unicode编码表,一个字符两个字节 例如:中是20013
把英文字母和其他语言转化成UTF-8编码(可变长编码),一个英文字符是一个字节,一个中文字符是三个字节
python的字符串
python3版本中,字符串以Unicode编码,支持多语言
使用函数ord()把一个字符转化成10进制整数,例如:print(ord('A')) 输出 65
使用函数char()把10进制整数转化成字符,例如:print(chr(20013)) 输出 中
如果要把字符保存在硬盘上或者在网络传输,需要把字符转成字节
调用str对象的encode()方法,把字符串转成字节,
例如:print("taoshihan".encode("utf-8")) 输出 b'taoshihan'
print("陶士涵".encode("utf-8")) 输出 b'\xe9\x99\xb6\xe5\xa3\xab\xe6\xb6\xb5'
python定义bytes数据用前缀加个b
从网络读取数据是字节流,使用decode(“utf-8”)来转成字符
例如:print(b'\xe9\x99\xb6\xe5\xa3\xab\xe6\xb6\xb5'.decode("utf-8")) 输出 陶士涵
使用函数len()计算字符串的字符个数,例如:len(“陶”) 输出 1
给文件加编码注释 文件顶部加上 # -*- coding: utf-8 -*-
使用%运算符来格式化字符,进行字符串的变量替换
例如:info = "我是%s,我有%s块钱" % ("陶士涵",10000)
print(info) 输出:我是陶士涵,我有10000块钱
后面括号里面的内容一定要和前面的顺序对应好