day9集合和字符串
一、集合
1.认识集合(set)
集合是容器型数据类型,将{}作为容器的标志
里面多个数据用逗号隔开:{数据1,数据2,…}
可变的(支持增删改);无序(不支持小标操作)
元素的要求:
1)必须是不可变的数据
2)元素是唯一
2.空集合 - 不能用{}表示集合
set2 = set() #表示空集合
3.集合是无序的
print(({1, 2, 3}) == {3, 2, 1}) # True
4.集合的元素必须是不可变类型的数据
set1 = {1, 'abc', True, (10, 20)}
set1 = {1,'abc',True,[10,20]} #TypeError: unhashable type: 'list'
5.集合元素是唯一(两个集合合并会自动去重)
set3 = {10, 10, 20, 30, 40, 40, 50}
print(set3) # {'abc', 1, (10, 20)} 自动去重,因为集合的元素是唯一的
6.集合的增删改查
1)查 - 只能遍历
2)增 - 集合.add(元素) 集合.update(元素)
3)删 - 集合.remove(元素)
7.数学集合运算
python中使用的集合和数学集合是一个东西,并且支持数学集合运算
# 交集(&) - 或取两个集合中的公共元素
print(set5 & set2)
# 并集(|) - 将两个集合合并成一个集合
print(set5 | set2)
# 差集 (- ) - 获取集合1中去掉包含在集合2中的部分剩下的部分
print(set5 - set2)
# 对称差(^) - 将两个集合合并然后去掉公共部分
print(set5 ^ set2)
子集(>= 、 <=)、真子集(> 、 <)
# 集合1 > 集合2 - 判断集合2是否是集合1的真子集
# 集合1 < 集合2 - 判断集合1是否是集合2的真子集
print({1, 2, 3, 4} > {1, 2, 3})
二、字符串
1.什么是字符串(str)
字符串是容器型数据类型,将’ '、 " "、 ‘’‘ ’‘’、 “”“ ”“” 作为容器标志
引号里面的每一个符号都是字符串的元素(字符串的元素叫字符)
不可变的(不支持增删改的操作)、有序的(支持下标操作)
字符串的元素:一切符号都可以作为字符串的元素,字符串元素又叫字符,字符分为两种:普通字符和转义字符
'''字符分普通字符和转义字符
1)普通字符 - 表示符号本身的字符就是普通字符
2)转义字符 - 具备特殊功能或者特殊意义的符号就是转义字符,所有的转义字符的通用格式:\n 、 \nnn
(转义字符是通过\加普通字符构成的,但是不是所有的普通字符前加\都可以成转义字符)
\n - 换行
\t - 水平指标符(相当于按一次Tab键)
\' - 一个单引号
\" - 一个双引号
\\ - 一个反斜杠
注意:不管转义符有多长,它只代表一个数值'''
str1 = 'ab'
str2 = "abc123"
str3 = '''123'''
str4 = """m"""
# 空串
str5 = ''
2.字符 - 字符串的每个独立的符号就是一个字符,字符可以是任何字符
\u 4位的十六进制数
# 十六进制数 - 每一位上的数可以是0-9或者a-f(A-F)
# 298235 - 十进制数
3.字符编码
每个文字符号(字符)在计算机中都对应一个固定数据,这个数字就是这个符号的在编码表中的编码值
'''常用编码表:ASCII码表、Unicode编码表(python)
1)ASCII码表 只有128个字符(不够用)
在ASCII码表中:数字字符在字母的前面、大写字母在小写字母的前面,大写字母和小写字母之间有间隙、
数字从0从开始连续递增。字母从(a/A)开始连续递增
0(47)-9(55) A-65.。。。 a - 97.。。。。
2)Unicode编码表 - 是ASCII码表的扩展,里面包含了ASCII码表
Unicode编码表中包世界上所有的国家所有的民族的所有符号(万国码)
中文编码范围:4e00~9fa5
'''
4.编码值在python中的应用
1)chr函数:chr(编码值) - 根据编码值对应的字符
2)ord函数:ord(字符) - 获取字符对应的编码值:字符 - 长度是1的字符串
3)hex(数字) - 将数字转换成16进制
print(chr(97)) #a
print(chr(65))#A
print(hex(12)) #0xc
5.字符串的常用操作
1)查 - 获取字符
字符串获取字符和列表获取元素的语法是通用的,列表获取元素的语法可以用于字符串获取字符串
2)字符串相关操作
a +(合并) 、 * (重复)
b 比较大小: > < >= <=
'''
比较大小,比的是第一对不相等的字符的编码的大小(根据字符串在表中的编码来比较)
应用:判断字符的性质
a 判断字符是否是数字字符:'0'<= x <= '9'
b 判断字符是否是小写字母:'a'<= x <= 'z'
c 判断字符是否是大写字母:'A'<= x <= 'Z'
d 判断字符是否是字母:'a'<= x <= 'z' or 'A'<= x <= 'Z'
e 判断字符是否是中文:'\u4e00'<= x <= '\u9fa5'
'''
print('abc'>'mn') #比较大小,比的是第一对不相等的字符的编码的大小(根据字符串在表中的编码来比较
c in 和 not in
字符串1 in 字符串2 – 判断字符串1 是否在字符串 2 中(判断字符串1 是否是字符串2 的子串)
str1 = 'abc123'
print('a' in str1) #True
print('abc' in str1) #True
print('23' in str1) #True
print('13' in str1) #False 判断字符必须是连续性