第八天 集合和字符串

1. 什么是集合(set)

  1. 集合是容器型数据类型;将{}作为容器的标志,里面多个元素用逗号隔开:{元素1, 元素2, 元素3,…}
  2. 可变的;无序
  3. 元素的要求:
    a.必须是不可变类型的数据
    b.元素是唯一的 (自动去重)

空集合

s1 = set()
print(len(s1), type(s1))        # 0 <class 'set'>

集合无序

print({10, 20, 30} == {30, 20, 10})     # True

元素是不可变类型的数据

s2 = {10, 'abc', 23.9, (1, 2)}
print(s2)

s3 = {10, ‘abc’, 23.9, [1, 2]} # 报错!列表是可变数据不能作为集合元素

元素是唯一的

s4 = {10, 20, 10, 10, 30, 30}
print(s4)       # {10, 20, 30}

2.增删改查

1) 查 - 只能遍历

s5 = {29, 80, 56, 324}
for x in s5:
    print('x:', x)

2) 增

集合.add(元素) - 将元素添加到集合中

s5.add(100)
print(s5)       # {100, 324, 80, 56, 29}

3) 删

集合.remove(元素) - 删除指定元素,元素不存在报错
集合.discard(元素) - 删除指定元素,元素不存在不报错

s5.remove(80)
print(s5)       # {100, 324, 56, 29}

s5.discard(56)
print(s5)       # {100, 324, 29}

4)改 - 没有改的语法,如果要改就删除旧的,添加新的

python中的集合支持的数学集合运算:并集(|)、交集(&)、差集(-)、对称差集(^)、子集(>=、<=)、真子集(>、<)
A = {1, 2, 3, 4, 5, 6, 7}
B = {5, 6, 7, 8, 9}

1. 并集(|)

集合1 | 集合2 - 将两个集合合并产生一个新的集合
print(A | B) # {1, 2, 3, 4, 5, 6, 7, 8, 9}

2. 交集(&)

集合1 & 集合2 - 获取两个集合公共部分产生一个新的集合
print(A & B) # {5, 6, 7}

3. 差集(-)

集合1 - 集合2 - 获取集合1中没有包含在集合2中的元素,得到一个新的集合
集合2 - 集合1 - 获取集合2中没有包含在集合1中的元素,得到一个新的集合
print(A - B) # {1, 2, 3, 4}
print(B - A) # {8, 9}

4. 对称差集(^)

集合1 ^ 集合2 - 两个集合合并去掉公共部分
print(A ^ B) # {1, 2, 3, 4, 8, 9}

5.子集和真子集

{1, 2, 3}的子集有:{}、{1}、{2}、{3}、{1, 2}、{2, 3}、{1, 3}、{1, 2, 3} - >=、<=
集合1 >= 集合2 - 判断集合2是否是集合1的子集
集合1 <= 集合2 - 判断集合1是否是集合2的子集

{1, 2, 3}的真子集有:{}、{1}、{2}、{3}、{1, 2}、{2, 3}、{1, 3}
集合1 > 集合2 - 判断集合2是否是集合1的真子集
集合1 < 集合2 - 判断集合1是否是集合2的真子集

print({1, 2, 3} > {0}) # False
print({1, 2, 3} > {1}) # True

1. 字符串(str)

1)字符串是容器型数据类型;将’’、""、""""""、’’’’’'作为容器的标志,里面的每一个符号就是它的一个元素。
2)字符串不可变;字符串有序
3)字符串元素:引号中的每一个符号都是字符串的元素,又叫字符。
字符分为普通字符和转义字符两种:
普通字符 - 在字符串中表示符号本身的字符

1)三个引号开头的字符串,字符串内容可以直接换行

str1 = 'abc'
str2 = "abc"
str3 = '''abc'''
str4 = """abc"""
print(type(str1), type(str2), type(str3), type(str4))

str5 = """床前明月光,
疑是地上霜;
举头望明月,
低头思故乡。"""
print(str5)

2)字符 - 字符串的元素

普通字符

转义字符

str1 = '\tabc\n123\u4e00'
print(str1)

3)字符串有序

print(‘abc’ == ‘bac’) # False

1. 字符 - 字符串的每个元素

1)转义字符 - 在特定的一些符号前加\来表示特殊功能或者特殊意义的符号

常用的转义字符:
\n - 换行(相当于按回车)
\t - 水平制表符(相当于按tab键)
’ - 一个普通的单引号
" - 一个普通的单引号
\ - 一个普通的反斜杠

\u4位的16进制数 - 编码字符

print(’\tabc\n123’)

2) R语法

#如果在字符串的最前面加r或者R可以让字符串中所有的转义字符功能消失,每个符号都会变成普通字符

str1 = R'\tabc\n123\'mn'
print(str1)    # \tabc\n123\'mn

1. 计算机存储数据的原理

计算机只具备存储数字的能力

2. 字符编码

为了能够让计算机存储文字信息,给每一个符号对应了一个固定的数字,每次需要存储文字符号的时候就存储这个符号对应的数字。
这个数字就是这个符号编码值。

3.编码表 - 保存不同字符对应的编码值的表

1)ASCII码表
有128个符号(美国符号)
数字在大写字母的前面,大写字母在小写字母前面,大写字母和小写字母之间有间隙

2)Unicode编码表(Python)
Unicode编码表中包含了ASCII码表
Unicode包含了世界上所有的国家所有的民族的所有符号,又叫万国码
中文范围:4e00 ~ 9fa5

4.Python对编码值的使用

1)chr函数chr(编码值) - 获取编码值对应的字符

print(chr(97))     # 'a'
print(chr(0x9e00))      # '鸀'
# 打印所有中文
num = 0
for x in range(0x4e00, 0x9fa5+1):
    print(chr(x), end=' ')
    num += 1
    if num % 30 == 0:
        print()
print(num)

2)ord函数

ord(字符) - 获取字符对应的编码值

3)编码字符

\u4的16进制数 - 创建一个字符,字符就是4的16进制数作为编码值对应的字符

str1 = '\u3991\u3938\u5437'
print(str1)
x = '好'
print('\u4e00' <= x <= '\u9fa5')

2. 二进制

基数:0、1
表示方式: 加前缀0b、0B
转换方法:bin(其他进制的数)

print(0b1100)       # 12
print(12 + 1)       # 13
print(0b1100 + 1)   # 13
print(bin(12))      # 0b1100
print(bin(42))      # 0b101010

3.八进制

基数:0、1、2、3、4、5、6、7
表示方式:加前缀0o、0O
转换方式:oct(其他进制的数据)


print(0o56)     # 46

4.十六进制

基数:0、1、2、3、4、5、6、7、8、9、a/A、b/B、c/C、d/D、e/E、f/F
表示方式:加前缀0x、0X
转换方式:hex(其他进制的数)

字符串不可变,所以只支持查操作

1. 查 - 获取字符

字符串获取字符和列表获取元素对应的语法一模一样的

str1 = 'abc123'
print(str1[2], str1[-4])

print(str1[1:])    # 'bc123'
print(str1[1:-1:2])     # 'b1'
print(str1[3:1:2])      # ''

for x in str1:
    print('x:', x)

每一个有效转义字符的长度都是1

str2 = '\ta\u4e00bc\n123\\'
print(str2[1])
print(str2[3])

str2 = r'\ta\u4e00bc\n123\\'
print(str2[2])
print(str2[9])

2. in 和 not in

字符串1 in 字符串2 - 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的子串)

print('ab' in 'abc')        # True
print('a' in 'abc')         # True
print('ab' in 'acb')        # False
  1. 用三个集合表示三门学科的选课学生姓名(一个学生可以同时选多门课)
art = {'小樱', '井野', '天天', '雏田', '迪达拉'}
gym = {'佐助', '鸣人', '天天', '小樱'}
music = {'小樱', '佐助', '雏田', '鹿丸'}
  1. 求选课学生总共有多少人
stu1 = art | gym | music
print('选课学生总共有:', len(stu1))
  1. 求只选了第一个学科的人的数量和对应的名字
stu2 = art - gym - music
print("只选了第一门学科的人数为:", len(stu2))
print("只选了第一门学科的人有:", end=" ")
for x in stu2:
    print(x, end=" ")
  1. 求只选了一门学科的学生的数量和对应的名字
stu2 = art - gym - music
stu3 = gym - art - music
stu4 = music - art - gym
stu5 = stu2 | stu3 | stu4
print("只选了一门学科的人数为:", len(stu5))
print("只选了一门学科的人有:", end=" ")
for x in stu5:
    print(x, end=" ")
  1. 求只选了两门学科的学生的数量和对应的名字
stu6 = art & gym - music
stu7 = gym & music - art
stu8 = music & art - gym
stu9 = stu6 | stu7 | stu8
print("只选了两门学科的人数为:", len(stu9))
print("只选了两门学科的人有:", end=" ")
for x in stu9:
    print(x, end=" ")
  1. 求选了三门学生的学生的数量和对应的名字
stu = art.intersection(gym, music)
print("选了三门学科的人数为:", len(stu))
print("选了三门学科的人有:", end=" ")
for x in stu:
    print(x, end=" ")
  1. 输入一个字符串,打印所有奇数位上的字符(下标是1,3,5,7…位上的字符)

    例如: 输入’abcd1234 ’ 输出’bd24’

str1 = input('请输入一个字符串:')
for x in range(1, len(str1), 2):
    print(str1[x], end='')
  1. 输入用户名,判断用户名是否合法(用户名长度6~10位)
str1 = input('请输入用户名:')
if 6 <= len(str1) <= 20:
    print('用户名合法')
else:
    print('用户名不合法')
  1. 输入用户名,判断用户名是否合法(用户名中只能由数字和字母组成)

    例如: ‘abc’ — 合法 ‘123’ — 合法 ‘abc123a’ — 合法

str1 = input('请输入用户名:')                                                                                                                                          
for index in str1:                                                                                                                                               
    if not ('0' <= index <= '9' or 'a' <= index <= 'z' or 'A' <= index <= 'Z'):                                                                                  
        print('用户名不合法')                                                                                                                                          
        break                                                                                                                                                    
else:                                                                                                                                                            
    print('用户名合法')                                                                                                                                                                                                                          
  1. 输入用户名,判断用户名是否合法(用户名必须包含且只能包含数字和字母,并且第一个字符必须是大写字母)

    例如: ‘abc’ — 不合法 ‘Mabc’ — 不合法 ‘123’ — 不合法 ‘abc123’ — 不合法 ‘Abc123ahs’ — 合法

str1 = input('请输入用户名:')                                                                               
count = 0                                                                                             
if 'A' <= str1[0] <= 'Z':                                                                             
    for index in str1:                                                                                
        if not ('0' <= index <= '9' or 'a' <= index <= 'z' or 'A' <= index <= 'Z'):                   
            print('用户名不合法')                                                                           
            break                                                                                     
        else:                                                                                         
            if '0' <= index <= '9':                                                                   
                count += 1                                                                            
    else:                                                                                             
        if count > 0:                                                                                 
            print('用户名合法')                                                                            
        else:                                                                                         
            print('用户名不合法')                                                                           
else:                                                                                                 
    print('用户名不合法')                                                                                   
  1. 输入一个字符串,将字符串中所有的数字字符取出来产生一个新的字符串

    例如:输入**‘abc1shj23kls99+2kkk’** 输出:'123992’

str1 = input('请输入一个字符串:')
str2 = ''
for x in str1:
    if '0' <= x <= '9':
        str2 += x
print(str2)
  1. 输入一个字符串,将字符串中所有的小写字母变成对应的大写字母输出 (用upper方法和自己写算法两种方式实现)

    例如: 输入**‘a2h2klm12+’ ** 输出 'A2H2KLM12+'

# 方法1
str1 = input('请输入一个字符串:')
print(str1.upper())

# 方法2
str1 = input('请输入一个字符串:')
str2 = ''
for x in str1:
    if not 'a' <= x <= 'z':
        str2 += x
    elif 'a' <= x <= 'z':
        x = chr(ord(x) - 32)
        str2 += x
print(str2)

  1. 输入一个小于1000的数字,产生对应的学号

    例如: 输入**‘23’,输出’py1901023’** 输入**‘9’, 输出’py1901009’** 输入**‘123’,输出’py1901123’**

num = input('输入一个小于1000的数字:')
print('py1901'+num.zfill(3))
  1. 输入一个字符串,统计字符串中非数字字母的字符的个数

    例如: 输入**‘anc2+93-sj胡说’** 输出:4 输入**’===’** 输出:3

str1 = input('输入一个字符串:')
count = 0
for index in str1:
    if not ('0' <= index <= '9' or 'a' <= index <= 'z' or 'A' <= index <= 'Z'):
        count += 1
print(count)
  1. 输入字符串,将字符串的开头和结尾变成’+’,产生一个新的字符串

    例如: 输入字符串**‘abc123’, 输出’+bc12+’**

str1 = input('请输入字符串:')
result = '+' + str1 + '+'
print(result)
  1. 输入字符串,获取字符串的中间字符

    例如: 输入**‘abc1234’** 输出:‘1’ 输入**‘abc123’** 输出**‘c1’**

str1 = input('请输入字符串:')
length = len(str1)
if length % 2 == 0:
    print(str1[length//2-1:length//2+1])
else:
    print(str1[length // 2])
  1. 写程序实现字符串函数find/index的功能(获取字符串1中字符串2第一次出现的位置)

    例如: 字符串1为:how are you? Im fine, Thank you! , 字符串2为:you, 打印8

str1 = input('请输入字符串:')
str2 = input('查找的字符串:')
length1 = len(str1)
length2 = len(str2)
for i in range(length1 - length2 + 1):
    if str1[i:i + length2] == str2:
        print(i)
        break
else:
    print('没有!')
  1. 获取两个字符串中公共的字符

    例如: 字符串1为:abc123, 字符串2为: huak3 , 打印:公共字符有:a3

str1 = input('请输入字符串1:')
str2 = input('请输入字符串2:')
str3 = ''
for i in str1:
    if i in str2 and i not in str3:
        str3 += i
print(str3)
上一篇:基础


下一篇:QT乱翻书-QStringDemo