day9集合和字符串

1、集合

1、认识集合

​ 1、集合是容器型数据类型,将{}作为容器的标志里面多个数据用逗号隔开:
​ {数据1,数据2,数据3…}

# 空集合(有意义的)
set1 = set()
print(type(set1), len(set1))     # <class 'set'> 0

​ 2、集合是可变的(支持增删改);无序的(不支持下标操作)

# 集合是无序的
print({1, 2, 3} == {3, 2, 1})       # True

​ 3、集合对元素的要求:1.必须是不可变的数据 2.元素是唯一的

# 集合元素必须是不可变类型的数据
set2 = {1, 'abc', True, (10, 20)}
print(set2)                         # {1, 'abc', (10, 20)}

# set2 = {1, 'abc', True, [10, 20]}
# print(set1)                         # 报错,列表是可变的

# 集合元素是唯一的
set3 = {10, 20, 30, 10, 30, 20}
print(set3)                             # {10, 20, 30}自带去重效果

names = ['张三', '李四', '王二', '王五', '张三', '王二']
print(set(names))                

2、集合的增删改查(了解)

​ 1、查 - 只能遍历

# 补充:用for循环遍历无序序列的时候,系统在遍历之前会自动将无序序列转换为列表,然后再遍历列表
set4 = {'进击的巨人', '海贼王', '一拳超人', '我都超人学院', '一人之下', '死亡笔记'}
print(list(set4))
for x in set4:
    print(x)

​ 2、增

a.集合.add(元素)  -   添加指定元素
b.集合.add(序列)  -   将序列中所有的元素都添加到集合中
set4 = {'进击的巨人', '海贼王', '一拳超人', '我都超人学院', '一人之下', '死亡笔记'}

set4.add('秦时明月')
print(set4)     # {'死亡笔记', '海贼王', '秦时明月', '一拳超人', '一人之下', '我都超人学院', '进击的巨人'}

​ 3、删

集合.remove(元素)   -   删除指定元素
set4 = {'进击的巨人', '海贼王', '一拳超人', '我都超人学院', '一人之下', '死亡笔记'}
set4.remove('一拳超人')
print(set4)     # {'死亡笔记', '海贼王', '一人之下', '我都超人学院', '进击的巨人'}

3、数学集合运算

# python中使用的集合和数学集合是一个东西,并且支持数学集合运算
# python支持的数学集合运算:交集(&)、并集(|)、差集(-)、对称差集(^)、子集(>=,<=)、真子集(>,<)

​ 1、交集:获取两个集合的公共部分

set1 = {1, 2, 3, 4, 5}
set2 = {2, 4, 5, 6, 8}
print(set1 & set2)          # {2, 4, 5}

​ 2、并集:将两个集合合并成一个集合

set1 = {1, 2, 3, 4, 5}
set2 = {2, 4, 5, 6, 8}
print(set1 | set2)          # {1, 2, 3, 4, 5, 6, 8}

​ 3、差集

​ 1)集合1 - 集合2 :获取集合1中去掉包含2中的部分剩下的部分

​ 2)集合2 - 集合1 :获取集合2中去掉包含1中的部分剩下的部分

set1 = {1, 2, 3, 4, 5}
set2 = {2, 4, 5, 6, 8}
print(set1 - set2)          # {1, 3}
print(set2 - set1)          # {8, 6}

​ 4、对称差集:将两个集合合并然后去掉公共部分

set1 = {1, 2, 3, 4, 5}
set2 = {2, 4, 5, 6, 8}
print(set1 ^ set2)          # {1, 3, 6, 8}

​ 5、子集和真子集

​ 1)集合1 > 集合2 - 判断集合2是否是集合1的真子集
​ 2)集合2 > 集合1 - 判断集合1是否是集合2的真子集

set1 = {1, 2, 3, 4, 5}
set2 = {2, 4, 5, 6, 8}
print({1, 2} < {1, 2, 3})   # True
# 练习 用三个集合表示三门学科的选课学生姓名(一个学生可以同时选多门课)

math1 = {'小明', '王昭君', '貂蝉', '李白', '张良'}
english1 = {'张良', '诸葛亮', '韩信', '甄姬', '李白'}
chinese = {'貂蝉', '张良', '西施', '公孙离', '甄姬', '小明'}

# 1. 求选课学生总共有多少人
set1 = math1 | english1 | chinese
print(len(set1))			# 10

# 2、求只选了第一个学科的人的数量和对应的名字
set2 = math1 - english1 - chinese
print(len(set2), set2)          # 1 {'王昭君'}

# 3. 求只选了一门学科的学生的数量和对应的名字
set3 = math1 & english1 & chinese
set4 = math1 ^ english1 ^ chinese ^ set3
print(len(set4), set4)          # 5 {'公孙离', '王昭君', '西施', '诸葛亮', '韩信'}

# 4. 求只选了两门学科的学生的数量和对应的名字
set1 = math1 | english1 | chinese
set3 = math1 & english1 & chinese
set4 = math1 ^ english1 ^ chinese ^ set3
set6 = set1-set3-set4
print(len(set6), set6)              # 4 {'貂蝉', '小明', '李白', '甄姬'}

# 5. 求选了三门学生的学生的数量和对应的名字
set3 = math1 & english1 & chinese
print(len(set3), set3)          # 1 {'张良'}

2、字符串

1、什么是字符串

​ 1、认识字符串

​ 1)字符串是容器型数据类型

​ 2)将’ ‘、" "、’’’ ‘’’、""" “”"作为容器的标志

​ 3)符号里的每一个符号都是字符串的元素(字符串的元素又叫字符)

​ 2、作为容器的特点

​ 1)不可变的(不支增删改)

​ 2)有序的(支持下标操作)

​ 3、字符串的元素

​ 1)一切符号都可以作为字符串的元素,字符串的元素又叫字符

​ 2)字符分为两种:普通字符和转义字符

# 空串
str1 = ''
print(len(str1))            # 0

2、字符

字符串中每一个独立的符号就是一个字符

1、字符分为普通字符和转义字符

​ 1)普通字符:表示符号本身的字符就是普通字符

​ 2)转义字符

​ a.本身具备特殊功能或者特殊意义的符号就是转义字符,所有的转义字符的通用格式:\X、\XXX

​ b.转义字符是通过\加普通字符够成的,单不算所有的普通字符前加\都能构成转义字符

​ c.注意:所有的转义字符的长度都是1

"""
	\n  -   换行
	\t  -   水平制表符(相当于按一次tab键)
	\'  -   一个单引号
	\"  -   一个双引号
	\\  -   一个反斜杠
"""

# \u4位的十六进制数    -   编码字符
# 十六进制数 -   每一位上的数可以是0~9或a~f(A~F)
print('\tabc\n123')
print("I say:'you see see, one day day!'")  # I say:'you see see, one day day!'
print('I say:\'you see see, one day day!\'')    # I say:'you see see, one day day!'
print('I say:\"you see see, one day day!\"')    # I say:"you see see, one day day!"
print('abc\\n123')      # abc\n123
print('\u1248')
print('\u92df=\uaf21')

3、字符编码

​ 1、计算机存储数据的原理

​ 1)计算机能够直接存储的数据只有数字,存数字的时候保存的是数字的补码
​ 2)如果想要将非数字数据保存到计算机中,在存储的时候一定会先将数据转换成数字

​ 3)如果需要存储的是文字,计算机会保存这个文字符号对应的编码值

​ 2、编码值:

​ 每个文字符号(字符)在计算机中都对应一个固定的数字,这个数字就说这个符号的编码值

​ 3、字符编码表 - 记录每个符号和数字对应关系的表

​ 常用编码表:ASCII码表、Unicode编码表(python)

​ 1)ASCII码表
​ a. ASCII码表只有128个字符(不够用)
​ b.在ASCII码表中:数字字符在字母的前面、大写字母在小写字母的前面、大写字母和小写字母之间有间隙、
​ c. 数字从0开始连续递增,字母从(a/A)开始连续递增
​ a - 97
​ A - 65

​ 2)Unicode编码表 - 是ASCII码表的拓展,里面包含ASCII码表
​ a.Unicode编码表中包含了世界上所有的国家所有的民族的所有符号(万国码)
​ b.中文编码范围:4e00~9fa5

​ 4、编码值在python中的应用
​ 1)chr函数: chr(编码值) - 获取编码值对应的字符;编码值 - 整数
​ 2)ord函数:ord(字符) - 获取字符对应的编码值;字符 - 长度是1的字符串
​ 3)编码字符

print(chr(97), chr(65))
# print(chr(0x2800))

for x in range(0x2800, 0x28ff+1):
    print(chr(x))

# 程序中直接表示一个16进制数:加前缀0x/0X
for x in range(0x4e00, 0x9fa5+1):
    print(chr(x), end=' ')

# hex(数字)   -   将数字转换成16进制
print(hex(ord('❀')))        # 0x2740

# 判断指定的字符是否是中文字符
ch = '谢'
print('\u4e00' <= ch <= '\u9fa5')
print(chr(0x9fa5))

4、字符串常用操作

​ 1.查 - 获取字符

str1 = 'hello world!'
print(str1[1], str1[-1])    # e !

str2 = '\t123\u5fa3abc'
print(str2[5])          # a

str1 = 'hello world!'
print(str1[-3:])            # 'ld!'
print(str1[-5::-1])         # 'ow olleh'

​ 2、字符串相关操作

​ 1)运算符:+、*

str1 = 'abc'
str2 = '123'
print(str1 + str2)          # ‘abc123’

print(str1 * 3)             # 'abcabcabc'

​ 2)比较大小:>、<、>=、<=

"""
两个字符串比较大小,比较的是第一对不相等的字符的编码值大小

应用:用比较运算符判断字符的性质
a.判断字符x是否是数字字符:'0' <= x <= '9'
b.判断字符x是否是小写字母:'a' <= x <= 'z'
c.判断字符x是否是大写字母:'A' <= x <= 'Z'
d.判断字符x是否是字母:'a' <= x <= 'z' or 'A' <= x <= 'Z'
f.判断字符x是否是中文:'\u4e00' <= x <= '\u9fa5'

"""
print('abc' > 'mn')         # False
print('abc' > 'Zn')         # True

​ 3)in 和 not in

# 字符串1 in字符串2   -   判断字符串1是否在字符串2中(判断字符串1是否是字符串2的子串)
str1 = 'abc123'
print('a' in str1)          # True
print('abc' in str1)        # True
print('23' in str1)         # True
print('13' in str1)         # False
print('13' not in str1)     # True

作业

1、输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)

例如: 输入’abcd1234 ’ 输出’bd24’

str1 = input('请输入一个字符串:')
for x in str1[1::2]:
    print(x)

2、输入用户名,判断用户名是否合法(用户名长度6~10位)

str2 = input('请输入用户名:')
if 6 <= len(str2) <= 10:
    print('用户名合法')
else:
    print('用户名不合法')

3、输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)

例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法

str3 = input('请输入用户名:')
for x in str3:
    if not ('a' <= x <= 'z' or 'A' <= x <= 'Z' or '0' <= x <= '9'):
        print('用户名不合法')
        break
else:
    print('用户名合法')

4、输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)

例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法

str4 = input('请输入用户名:')
if 'A' <= str4[0] <= 'Z':
    for x in str4:
        if not (('a' <= x <= 'z' or 'A' <= x <= 'Z') or '0' <= x <= '9'):
            print('用户名不合法')
            break
    else:
        print('用户名合法')
else:
    print('用户名不合法')

5、输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串

例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’

str5 = input('请输入一个字符串:')
for x in str5:
    if '0' <= x <= '9':
        print(x, end='')
result = [x for x in str5 if '0' <= x <= '9']
print(result)

6、输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)

例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'

7、输入一个小于1000的数字,产生对应的学号

例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**

num = int(input('请输入一个小于1000的数字:'))
if num // 100 > 0:
    print('py1901' + str(num))
elif num //10 % 10 != 0:
    print('py19010' + str(num))
else:
    print('py190100' + str(num))

8、输入一个字符串,统计字符串中非数字字母的字符的个数

例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3

str8 = input('请输入一个字符串:')
count = 0
for x in str8:
    if not ('a' <= x <= 'z' or 'A' <= x <= 'Z' or '0' <= x <= '9'):
        count += 1
print(count)

9、输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串

例如: 输入字符串**‘abc123’, 输出’+bc12+’**

str9 = input('请输入一个字符串:')
new_str9 = str9[1:-1]
print('+' + new_str9 + '+')

10、输入字符串,获取字符串的中间字符

例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**

str10 = input('请输入一个字符串:')
if len(str10) % 2 == 0:
    print(str10[len(str10)//2-1], str10[len(str10)//2], sep='')
else:
    print(str10[len(str10) // 2])

11、写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)

例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8

12、获取两个字符串中公共的字符

例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

str12 = input('请输入你的字符串1:')
str13 = input('请输入你的字符串2:')
for x in str12:
    if x in str13:
        print(x, sep='', end='')
上一篇:响应式web技术dem07


下一篇:HTTP Client and Web Debugging Proxy to Troubleshoot Applications