1. 什么是集合(set)
- 集合是容器型数据类型;将{}作为容器的标志,里面多个元素用逗号隔开:{元素1, 元素2, 元素3,…}
- 可变的;无序
- 元素的要求:
a.必须是不可变类型的数据
b.元素是唯一的 (自动去重)
空集合
s1 = set()
print(len(s1), type(s1)) # 0 <class 'set'>
集合无序
print({10, 20, 30} == {30, 20, 10}) # True
元素是不可变类型的数据
s2 = {10, 'abc', 23.9, (1, 2)}
print(s2)
s3 = {10, ‘abc’, 23.9, [1, 2]} # 报错!列表是可变数据不能作为集合元素
元素是唯一的
s4 = {10, 20, 10, 10, 30, 30}
print(s4) # {10, 20, 30}
2.增删改查
1) 查 - 只能遍历
s5 = {29, 80, 56, 324}
for x in s5:
print('x:', x)
2) 增
集合.add(元素) - 将元素添加到集合中
s5.add(100)
print(s5) # {100, 324, 80, 56, 29}
3) 删
集合.remove(元素) - 删除指定元素,元素不存在报错
集合.discard(元素) - 删除指定元素,元素不存在不报错
s5.remove(80)
print(s5) # {100, 324, 56, 29}
s5.discard(56)
print(s5) # {100, 324, 29}
4)改 - 没有改的语法,如果要改就删除旧的,添加新的
python中的集合支持的数学集合运算:并集(|)、交集(&)、差集(-)、对称差集(^)、子集(>=、<=)、真子集(>、<)
A = {1, 2, 3, 4, 5, 6, 7}
B = {5, 6, 7, 8, 9}
1. 并集(|)
集合1 | 集合2 - 将两个集合合并产生一个新的集合
print(A | B) # {1, 2, 3, 4, 5, 6, 7, 8, 9}
2. 交集(&)
集合1 & 集合2 - 获取两个集合公共部分产生一个新的集合
print(A & B) # {5, 6, 7}
3. 差集(-)
集合1 - 集合2 - 获取集合1中没有包含在集合2中的元素,得到一个新的集合
集合2 - 集合1 - 获取集合2中没有包含在集合1中的元素,得到一个新的集合
print(A - B) # {1, 2, 3, 4}
print(B - A) # {8, 9}
4. 对称差集(^)
集合1 ^ 集合2 - 两个集合合并去掉公共部分
print(A ^ B) # {1, 2, 3, 4, 8, 9}
5.子集和真子集
{1, 2, 3}的子集有:{}、{1}、{2}、{3}、{1, 2}、{2, 3}、{1, 3}、{1, 2, 3} - >=、<=
集合1 >= 集合2 - 判断集合2是否是集合1的子集
集合1 <= 集合2 - 判断集合1是否是集合2的子集
{1, 2, 3}的真子集有:{}、{1}、{2}、{3}、{1, 2}、{2, 3}、{1, 3}
集合1 > 集合2 - 判断集合2是否是集合1的真子集
集合1 < 集合2 - 判断集合1是否是集合2的真子集
print({1, 2, 3} > {0}) # False
print({1, 2, 3} > {1}) # True
1. 字符串(str)
1)字符串是容器型数据类型;将’’、""、""""""、’’’’’'作为容器的标志,里面的每一个符号就是它的一个元素。
2)字符串不可变;字符串有序
3)字符串元素:引号中的每一个符号都是字符串的元素,又叫字符。
字符分为普通字符和转义字符两种:
普通字符 - 在字符串中表示符号本身的字符
1)三个引号开头的字符串,字符串内容可以直接换行
str1 = 'abc'
str2 = "abc"
str3 = '''abc'''
str4 = """abc"""
print(type(str1), type(str2), type(str3), type(str4))
str5 = """床前明月光,
疑是地上霜;
举头望明月,
低头思故乡。"""
print(str5)
2)字符 - 字符串的元素
普通字符
转义字符
str1 = '\tabc\n123\u4e00'
print(str1)
3)字符串有序
print(‘abc’ == ‘bac’) # False
1. 字符 - 字符串的每个元素
1)转义字符 - 在特定的一些符号前加\来表示特殊功能或者特殊意义的符号
常用的转义字符:
\n - 换行(相当于按回车)
\t - 水平制表符(相当于按tab键)
’ - 一个普通的单引号
" - 一个普通的单引号
\ - 一个普通的反斜杠
\u4位的16进制数 - 编码字符
print(’\tabc\n123’)
2) R语法
#如果在字符串的最前面加r或者R可以让字符串中所有的转义字符功能消失,每个符号都会变成普通字符
str1 = R'\tabc\n123\'mn'
print(str1) # \tabc\n123\'mn
1. 计算机存储数据的原理
计算机只具备存储数字的能力
2. 字符编码
为了能够让计算机存储文字信息,给每一个符号对应了一个固定的数字,每次需要存储文字符号的时候就存储这个符号对应的数字。
这个数字就是这个符号编码值。
3.编码表 - 保存不同字符对应的编码值的表
1)ASCII码表
有128个符号(美国符号)
数字在大写字母的前面,大写字母在小写字母前面,大写字母和小写字母之间有间隙
2)Unicode编码表(Python)
Unicode编码表中包含了ASCII码表
Unicode包含了世界上所有的国家所有的民族的所有符号,又叫万国码
中文范围:4e00 ~ 9fa5
4.Python对编码值的使用
1)chr函数chr(编码值) - 获取编码值对应的字符
print(chr(97)) # 'a'
print(chr(0x9e00)) # '鸀'
# 打印所有中文
num = 0
for x in range(0x4e00, 0x9fa5+1):
print(chr(x), end=' ')
num += 1
if num % 30 == 0:
print()
print(num)
2)ord函数
ord(字符) - 获取字符对应的编码值
3)编码字符
\u4的16进制数 - 创建一个字符,字符就是4的16进制数作为编码值对应的字符
str1 = '\u3991\u3938\u5437'
print(str1)
x = '好'
print('\u4e00' <= x <= '\u9fa5')
2. 二进制
基数:0、1
表示方式: 加前缀0b、0B
转换方法:bin(其他进制的数)
print(0b1100) # 12
print(12 + 1) # 13
print(0b1100 + 1) # 13
print(bin(12)) # 0b1100
print(bin(42)) # 0b101010
3.八进制
基数:0、1、2、3、4、5、6、7
表示方式:加前缀0o、0O
转换方式:oct(其他进制的数据)
print(0o56) # 46
4.十六进制
基数:0、1、2、3、4、5、6、7、8、9、a/A、b/B、c/C、d/D、e/E、f/F
表示方式:加前缀0x、0X
转换方式:hex(其他进制的数)
字符串不可变,所以只支持查操作
1. 查 - 获取字符
字符串获取字符和列表获取元素对应的语法一模一样的
str1 = 'abc123'
print(str1[2], str1[-4])
print(str1[1:]) # 'bc123'
print(str1[1:-1:2]) # 'b1'
print(str1[3:1:2]) # ''
for x in str1:
print('x:', x)
每一个有效转义字符的长度都是1
str2 = '\ta\u4e00bc\n123\\'
print(str2[1])
print(str2[3])
str2 = r'\ta\u4e00bc\n123\\'
print(str2[2])
print(str2[9])
2. in 和 not in
字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)
print('ab' in 'abc') # True
print('a' in 'abc') # True
print('ab' in 'acb') # False
- 用三个集合表示三门学科的选课学生姓名(一个学生可以同时选多门课)
art = {'小樱', '井野', '天天', '雏田', '迪达拉'}
gym = {'佐助', '鸣人', '天天', '小樱'}
music = {'小樱', '佐助', '雏田', '鹿丸'}
- 求选课学生总共有多少人
stu1 = art | gym | music
print('选课学生总共有:', len(stu1))
- 求只选了第一个学科的人的数量和对应的名字
stu2 = art - gym - music
print("只选了第一门学科的人数为:", len(stu2))
print("只选了第一门学科的人有:", end=" ")
for x in stu2:
print(x, end=" ")
- 求只选了一门学科的学生的数量和对应的名字
stu2 = art - gym - music
stu3 = gym - art - music
stu4 = music - art - gym
stu5 = stu2 | stu3 | stu4
print("只选了一门学科的人数为:", len(stu5))
print("只选了一门学科的人有:", end=" ")
for x in stu5:
print(x, end=" ")
- 求只选了两门学科的学生的数量和对应的名字
stu6 = art & gym - music
stu7 = gym & music - art
stu8 = music & art - gym
stu9 = stu6 | stu7 | stu8
print("只选了两门学科的人数为:", len(stu9))
print("只选了两门学科的人有:", end=" ")
for x in stu9:
print(x, end=" ")
- 求选了三门学生的学生的数量和对应的名字
stu = art.intersection(gym, music)
print("选了三门学科的人数为:", len(stu))
print("选了三门学科的人有:", end=" ")
for x in stu:
print(x, end=" ")
-
输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)
例如: 输入’abcd1234 ’ 输出’bd24’
str1 = input('请输入一个字符串:')
for x in range(1, len(str1), 2):
print(str1[x], end='')
- 输入用户名,判断用户名是否合法(用户名长度6~10位)
str1 = input('请输入用户名:')
if 6 <= len(str1) <= 20:
print('用户名合法')
else:
print('用户名不合法')
-
输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)
例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法
str1 = input('请输入用户名:')
for index in str1:
if not ('0' <= index <= '9' or 'a' <= index <= 'z' or 'A' <= index <= 'Z'):
print('用户名不合法')
break
else:
print('用户名合法')
-
输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)
例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法
str1 = input('请输入用户名:')
count = 0
if 'A' <= str1[0] <= 'Z':
for index in str1:
if not ('0' <= index <= '9' or 'a' <= index <= 'z' or 'A' <= index <= 'Z'):
print('用户名不合法')
break
else:
if '0' <= index <= '9':
count += 1
else:
if count > 0:
print('用户名合法')
else:
print('用户名不合法')
else:
print('用户名不合法')
-
输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串
例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’
str1 = input('请输入一个字符串:')
str2 = ''
for x in str1:
if '0' <= x <= '9':
str2 += x
print(str2)
-
输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)
例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'
# 方法1
str1 = input('请输入一个字符串:')
print(str1.upper())
# 方法2
str1 = input('请输入一个字符串:')
str2 = ''
for x in str1:
if not 'a' <= x <= 'z':
str2 += x
elif 'a' <= x <= 'z':
x = chr(ord(x) - 32)
str2 += x
print(str2)
-
输入一个小于1000的数字,产生对应的学号
例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**
num = input('输入一个小于1000的数字:')
print('py1901'+num.zfill(3))
-
输入一个字符串,统计字符串中非数字字母的字符的个数
例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3
str1 = input('输入一个字符串:')
count = 0
for index in str1:
if not ('0' <= index <= '9' or 'a' <= index <= 'z' or 'A' <= index <= 'Z'):
count += 1
print(count)
-
输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串
例如: 输入字符串**‘abc123’, 输出’+bc12+’**
str1 = input('请输入字符串:')
result = '+' + str1 + '+'
print(result)
-
输入字符串,获取字符串的中间字符
例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**
str1 = input('请输入字符串:')
length = len(str1)
if length % 2 == 0:
print(str1[length//2-1:length//2+1])
else:
print(str1[length // 2])
-
写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)
例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8
str1 = input('请输入字符串:')
str2 = input('查找的字符串:')
length1 = len(str1)
length2 = len(str2)
for i in range(length1 - length2 + 1):
if str1[i:i + length2] == str2:
print(i)
break
else:
print('没有!')
-
获取两个字符串中公共的字符
例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3
str1 = input('请输入字符串1:')
str2 = input('请输入字符串2:')
str3 = ''
for i in str1:
if i in str2 and i not in str3:
str3 += i
print(str3)