1、字符串可用单引号、双引号,但是不能一单一双或一双一单引用。三引号引用用来创建多行字符串。
2、字符串是不可变的序列数据类型。如下,直接修改元素的值是不被允许的。不能直接修改字符串本身,和数字类型一样!
3、字符串与列表的操作方法类似,支持加、乘、切片、索引、复制、成员判断等操作。
4、字符串最常用内置方法。
- string.encode()----编码乘bytes格式
- string.upper()----将字符串大写
- string.lower()----将字符串小写
- string.split()----分割字符串
- string.replace()----替换字符串中的值
- string.starwith()----以什么开头
- string.endwith()----以什么结尾
- string.find()----查找子串
5、字符串的编码
(1)常用的编码种类。
- ASCII编码。早期英语语系编码,一共255个字符,每个字符占一个字节,即8位。不支持中文。
- Unicode编码。又称万国码,国际组织制定的用于兼容世界上所有文字和符号的编码。一个汉字占2个字节。
- UTF-8编码。在Unicode基础上优化而成,更省空间。一个英文占1个字节,一个汉字占3个字节。兼容ASCII编码,应用广泛。
- GBK编码。全称《汉字内码扩展标准》,windows中文版的汉字编码使用的就是GBK。师姐范围内不通用。
(2)python3使用哪个编码?
python3在运行的时候全部使用Unicode编码。
(3)几条规则。
- 操作系统运行时,内存中都是使用Unicode编码。但是当需要将数据保存到硬盘或者文件系统时,才会编码成UTF-8,进行保存和运输。
- 编辑文件的时候,系统会将文件先编码乘Unicode到内存中,供系统或程序使用。在编辑 完成之后,再重新编码乘UTF-8进行保存。
- 浏览网页的时候,服务器会将动态生成的Unicode编码的内容编码成utf-8传输给客户端。