[Python] Python基础字符串

Python的语法采用缩进的方式,一般使用四个空格,并且是大小写敏感的

字符编码

计算机只能处理数字,如果要处理文本,必须先把文本转换成数字才能处理

采用8个比特(bit)作为一个字节(byte)

一个字节能表示的最大的整数是255(二进制11111111=十进制255)

把127个字母字符编码成一张ASCII编码,一个字符就一个字节,例如:A是65

把英文字母和其他语言编码成一张Unicode编码表,一个字符两个字节 例如:中是20013

把英文字母和其他语言转化成UTF-8编码(可变长编码),一个英文字符是一个字节,一个中文字符是三个字节

python的字符串

python3版本中,字符串以Unicode编码,支持多语言

使用函数ord()把一个字符转化成10进制整数,例如:print(ord('A')) 输出 65

使用函数char()把10进制整数转化成字符,例如:print(chr(20013)) 输出 中

如果要把字符保存在硬盘上或者在网络传输,需要把字符转成字节

调用str对象的encode()方法,把字符串转成字节,

例如:print("taoshihan".encode("utf-8")) 输出 b'taoshihan'

print("陶士涵".encode("utf-8"))  输出 b'\xe9\x99\xb6\xe5\xa3\xab\xe6\xb6\xb5'

python定义bytes数据用前缀加个b

从网络读取数据是字节流,使用decode(“utf-8”)来转成字符

例如:print(b'\xe9\x99\xb6\xe5\xa3\xab\xe6\xb6\xb5'.decode("utf-8")) 输出 陶士涵

使用函数len()计算字符串的字符个数,例如:len(“陶”) 输出 1

给文件加编码注释 文件顶部加上 # -*- coding: utf-8 -*-

使用%运算符来格式化字符,进行字符串的变量替换

例如:info = "我是%s,我有%s块钱" % ("陶士涵",10000)

print(info) 输出:我是陶士涵,我有10000块钱

后面括号里面的内容一定要和前面的顺序对应好

上一篇:bug fix: openstack can not run swift for pyeclib and liberasurecode do not match


下一篇:Drools 函数学习