1、集合
1、认识集合
1、集合是容器型数据类型,将{}作为容器的标志里面多个数据用逗号隔开:
{数据1,数据2,数据3…}
# 空集合(有意义的)
set1 = set()
print(type(set1), len(set1)) # <class 'set'> 0
2、集合是可变的(支持增删改);无序的(不支持下标操作)
# 集合是无序的
print({1, 2, 3} == {3, 2, 1}) # True
3、集合对元素的要求:1.必须是不可变的数据 2.元素是唯一的
# 集合元素必须是不可变类型的数据
set2 = {1, 'abc', True, (10, 20)}
print(set2) # {1, 'abc', (10, 20)}
# set2 = {1, 'abc', True, [10, 20]}
# print(set1) # 报错,列表是可变的
# 集合元素是唯一的
set3 = {10, 20, 30, 10, 30, 20}
print(set3) # {10, 20, 30}自带去重效果
names = ['张三', '李四', '王二', '王五', '张三', '王二']
print(set(names))
2、集合的增删改查(了解)
1、查 - 只能遍历
# 补充:用for循环遍历无序序列的时候,系统在遍历之前会自动将无序序列转换为列表,然后再遍历列表
set4 = {'进击的巨人', '海贼王', '一拳超人', '我都超人学院', '一人之下', '死亡笔记'}
print(list(set4))
for x in set4:
print(x)
2、增
a.集合.add(元素) - 添加指定元素
b.集合.add(序列) - 将序列中所有的元素都添加到集合中
set4 = {'进击的巨人', '海贼王', '一拳超人', '我都超人学院', '一人之下', '死亡笔记'}
set4.add('秦时明月')
print(set4) # {'死亡笔记', '海贼王', '秦时明月', '一拳超人', '一人之下', '我都超人学院', '进击的巨人'}
3、删
集合.remove(元素) - 删除指定元素
set4 = {'进击的巨人', '海贼王', '一拳超人', '我都超人学院', '一人之下', '死亡笔记'}
set4.remove('一拳超人')
print(set4) # {'死亡笔记', '海贼王', '一人之下', '我都超人学院', '进击的巨人'}
3、数学集合运算
# python中使用的集合和数学集合是一个东西,并且支持数学集合运算
# python支持的数学集合运算:交集(&)、并集(|)、差集(-)、对称差集(^)、子集(>=,<=)、真子集(>,<)
1、交集:获取两个集合的公共部分
set1 = {1, 2, 3, 4, 5}
set2 = {2, 4, 5, 6, 8}
print(set1 & set2) # {2, 4, 5}
2、并集:将两个集合合并成一个集合
set1 = {1, 2, 3, 4, 5}
set2 = {2, 4, 5, 6, 8}
print(set1 | set2) # {1, 2, 3, 4, 5, 6, 8}
3、差集
1)集合1 - 集合2 :获取集合1中去掉包含2中的部分剩下的部分
2)集合2 - 集合1 :获取集合2中去掉包含1中的部分剩下的部分
set1 = {1, 2, 3, 4, 5}
set2 = {2, 4, 5, 6, 8}
print(set1 - set2) # {1, 3}
print(set2 - set1) # {8, 6}
4、对称差集:将两个集合合并然后去掉公共部分
set1 = {1, 2, 3, 4, 5}
set2 = {2, 4, 5, 6, 8}
print(set1 ^ set2) # {1, 3, 6, 8}
5、子集和真子集
1)集合1 > 集合2 - 判断集合2是否是集合1的真子集
2)集合2 > 集合1 - 判断集合1是否是集合2的真子集
set1 = {1, 2, 3, 4, 5}
set2 = {2, 4, 5, 6, 8}
print({1, 2} < {1, 2, 3}) # True
# 练习 用三个集合表示三门学科的选课学生姓名(一个学生可以同时选多门课)
math1 = {'小明', '王昭君', '貂蝉', '李白', '张良'}
english1 = {'张良', '诸葛亮', '韩信', '甄姬', '李白'}
chinese = {'貂蝉', '张良', '西施', '公孙离', '甄姬', '小明'}
# 1. 求选课学生总共有多少人
set1 = math1 | english1 | chinese
print(len(set1)) # 10
# 2、求只选了第一个学科的人的数量和对应的名字
set2 = math1 - english1 - chinese
print(len(set2), set2) # 1 {'王昭君'}
# 3. 求只选了一门学科的学生的数量和对应的名字
set3 = math1 & english1 & chinese
set4 = math1 ^ english1 ^ chinese ^ set3
print(len(set4), set4) # 5 {'公孙离', '王昭君', '西施', '诸葛亮', '韩信'}
# 4. 求只选了两门学科的学生的数量和对应的名字
set1 = math1 | english1 | chinese
set3 = math1 & english1 & chinese
set4 = math1 ^ english1 ^ chinese ^ set3
set6 = set1-set3-set4
print(len(set6), set6) # 4 {'貂蝉', '小明', '李白', '甄姬'}
# 5. 求选了三门学生的学生的数量和对应的名字
set3 = math1 & english1 & chinese
print(len(set3), set3) # 1 {'张良'}
2、字符串
1、什么是字符串
1、认识字符串
1)字符串是容器型数据类型
2)将’ ‘、" "、’’’ ‘’’、""" “”"作为容器的标志
3)符号里的每一个符号都是字符串的元素(字符串的元素又叫字符)
2、作为容器的特点
1)不可变的(不支增删改)
2)有序的(支持下标操作)
3、字符串的元素
1)一切符号都可以作为字符串的元素,字符串的元素又叫字符
2)字符分为两种:普通字符和转义字符
# 空串
str1 = ''
print(len(str1)) # 0
2、字符
字符串中每一个独立的符号就是一个字符
1、字符分为普通字符和转义字符
1)普通字符:表示符号本身的字符就是普通字符
2)转义字符
a.本身具备特殊功能或者特殊意义的符号就是转义字符,所有的转义字符的通用格式:\X、\XXX
b.转义字符是通过\加普通字符够成的,单不算所有的普通字符前加\都能构成转义字符
c.注意:所有的转义字符的长度都是1
"""
\n - 换行
\t - 水平制表符(相当于按一次tab键)
\' - 一个单引号
\" - 一个双引号
\\ - 一个反斜杠
"""
# \u4位的十六进制数 - 编码字符
# 十六进制数 - 每一位上的数可以是0~9或a~f(A~F)
print('\tabc\n123')
print("I say:'you see see, one day day!'") # I say:'you see see, one day day!'
print('I say:\'you see see, one day day!\'') # I say:'you see see, one day day!'
print('I say:\"you see see, one day day!\"') # I say:"you see see, one day day!"
print('abc\\n123') # abc\n123
print('\u1248')
print('\u92df=\uaf21')
3、字符编码
1、计算机存储数据的原理
1)计算机能够直接存储的数据只有数字,存数字的时候保存的是数字的补码
2)如果想要将非数字数据保存到计算机中,在存储的时候一定会先将数据转换成数字
3)如果需要存储的是文字,计算机会保存这个文字符号对应的编码值
2、编码值:
每个文字符号(字符)在计算机中都对应一个固定的数字,这个数字就说这个符号的编码值
3、字符编码表 - 记录每个符号和数字对应关系的表
常用编码表:ASCII码表、Unicode编码表(python)
1)ASCII码表
a. ASCII码表只有128个字符(不够用)
b.在ASCII码表中:数字字符在字母的前面、大写字母在小写字母的前面、大写字母和小写字母之间有间隙、
c. 数字从0开始连续递增,字母从(a/A)开始连续递增
a - 97
A - 65
2)Unicode编码表 - 是ASCII码表的拓展,里面包含ASCII码表
a.Unicode编码表中包含了世界上所有的国家所有的民族的所有符号(万国码)
b.中文编码范围:4e00~9fa5
4、编码值在python中的应用
1)chr函数: chr(编码值) - 获取编码值对应的字符;编码值 - 整数
2)ord函数:ord(字符) - 获取字符对应的编码值;字符 - 长度是1的字符串
3)编码字符
print(chr(97), chr(65))
# print(chr(0x2800))
for x in range(0x2800, 0x28ff+1):
print(chr(x))
# 程序中直接表示一个16进制数:加前缀0x/0X
for x in range(0x4e00, 0x9fa5+1):
print(chr(x), end=' ')
# hex(数字) - 将数字转换成16进制
print(hex(ord('❀'))) # 0x2740
# 判断指定的字符是否是中文字符
ch = '谢'
print('\u4e00' <= ch <= '\u9fa5')
print(chr(0x9fa5))
4、字符串常用操作
1.查 - 获取字符
str1 = 'hello world!'
print(str1[1], str1[-1]) # e !
str2 = '\t123\u5fa3abc'
print(str2[5]) # a
str1 = 'hello world!'
print(str1[-3:]) # 'ld!'
print(str1[-5::-1]) # 'ow olleh'
2、字符串相关操作
1)运算符:+、*
str1 = 'abc'
str2 = '123'
print(str1 + str2) # ‘abc123’
print(str1 * 3) # 'abcabcabc'
2)比较大小:>、<、>=、<=
"""
两个字符串比较大小,比较的是第一对不相等的字符的编码值大小
应用:用比较运算符判断字符的性质
a.判断字符x是否是数字字符:'0' <= x <= '9'
b.判断字符x是否是小写字母:'a' <= x <= 'z'
c.判断字符x是否是大写字母:'A' <= x <= 'Z'
d.判断字符x是否是字母:'a' <= x <= 'z' or 'A' <= x <= 'Z'
f.判断字符x是否是中文:'\u4e00' <= x <= '\u9fa5'
"""
print('abc' > 'mn') # False
print('abc' > 'Zn') # True
3)in 和 not in
# 字符串1 in字符串2 - 判断字符串1是否在字符串2中(判断字符串1是否是字符串2的子串)
str1 = 'abc123'
print('a' in str1) # True
print('abc' in str1) # True
print('23' in str1) # True
print('13' in str1) # False
print('13' not in str1) # True
作业
1、输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入’abcd1234 ’ 输出’bd24’
str1 = input('请输入一个字符串:')
for x in str1[1::2]:
print(x)
2、输入用户名,判断用户名是否合法(用户名长度6~10位)
str2 = input('请输入用户名:')
if 6 <= len(str2) <= 10:
print('用户名合法')
else:
print('用户名不合法')
3、输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
str3 = input('请输入用户名:')
for x in str3:
if not ('a' <= x <= 'z' or 'A' <= x <= 'Z' or '0' <= x <= '9'):
print('用户名不合法')
break
else:
print('用户名合法')
4、输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
str4 = input('请输入用户名:')
if 'A' <= str4[0] <= 'Z':
for x in str4:
if not (('a' <= x <= 'z' or 'A' <= x <= 'Z') or '0' <= x <= '9'):
print('用户名不合法')
break
else:
print('用户名合法')
else:
print('用户名不合法')
5、输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’
str5 = input('请输入一个字符串:')
for x in str5:
if '0' <= x <= '9':
print(x, end='')
result = [x for x in str5 if '0' <= x <= '9']
print(result)
6、输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'
7、输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
num = int(input('请输入一个小于1000的数字:'))
if num // 100 > 0:
print('py1901' + str(num))
elif num //10 % 10 != 0:
print('py19010' + str(num))
else:
print('py190100' + str(num))
8、输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3
str8 = input('请输入一个字符串:')
count = 0
for x in str8:
if not ('a' <= x <= 'z' or 'A' <= x <= 'Z' or '0' <= x <= '9'):
count += 1
print(count)
9、输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+’**
str9 = input('请输入一个字符串:')
new_str9 = str9[1:-1]
print('+' + new_str9 + '+')
10、输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
str10 = input('请输入一个字符串:')
if len(str10) % 2 == 0:
print(str10[len(str10)//2-1], str10[len(str10)//2], sep='')
else:
print(str10[len(str10) // 2])
11、写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
12、获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str12 = input('请输入你的字符串1:')
str13 = input('请输入你的字符串2:')
for x in str12:
if x in str13:
print(x, sep='', end='')