字符编码:因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理,最早的计算机在设计时采用8个比特(bit)作为一个字节
(byte),所以,一个字节能表示的最大的整数是255(二进制1111111=十进制255),如果要表示更大的整数,就必须用更大的整数,就必须用更多的字节
,比如,两个字节可以表示的最大整数是65535
字符 | ASCII | unicode | utf -8 |
A | 01000001 | 00000000 01000001 | 01000001 |
中 | x | 01001110 00101101 | 11100100 10111000 10101101 |
所以你会看到很多网页源码上会有类似的<meta charset ="UTF-8" /}
Python 的字符串:
包含中文的str
对于单个字符的编码,python 提供了ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符,
chr()函数把编码转化为对应的字符:
要计算str包含是多少个字符,可以用len()函数
len()
bytes,字节数
#!/usr/bin/env python
#-*-coding :utf-8 -*-
格式化
‘hello ,%s"%"world'
占位符:
%d 整数
%f 浮点数
%s 字符串
%x 十六进制整数
format()
'Hello ,{0},成绩提升了{1:.f}%.format('小明',17.125)