集合的操作:
集合(set)是一个无序的不重复元素序列。1,2,3,4,1,2,3 = 1,2,3,4
- 集合的创建
注意点1: 集合的元素必须是不可变数据类型。
注意点2: 空集合不能使用{}, 而要使用set()
s = {1, 2, 3, 1, 2, 3} # {1, 2, 3}
print(s, type(s))
# 注意点1: 集合的元素必须是不可变数据类型。
# s = {1, 2, 3, [1, 2, 3]}
# print(s, type(s)) (报错)
# 注意点2:空集合不能使用{}, 而要使用set()
# s = {}
# print(s, type(s)) ({} <class 'dict'>)
s = set()
print(s, type(s))
- 集合的特性
不支持+, * , index, slice(因为集合无序不重复的)
支持in和not in
print(1 in {1, 2, 3, 4})
#True
- 集合的常用操作:
3-1. 增加
add: 添加单个元素
update: 添加多个元素
s = {1, 2, 3}
s.add(100)
print(s)
# {1, 2, 3, 100}
s = {1, 2, 3}
s.update({4, 5, 6})
print(s)
# {1, 2, 3, 4, 5, 6}
3-2 删除
remove: 如果元素存在,删除,否则报错
discard: 如果元素存在,删除,否则do nothing
pop: 随机删除元素,集合为空则报错
s = {1, 2, 3}
s.remove(3)
print(s)
# {1, 2}
s = {1, 2, 3}
s.discard(100)
print(s)
# {1, 2, 3}
s = {1, 66, 2,99, 78, 3}
s.pop()
print(s)
# {66, 99, 2, 3, 78}
3-3. 查看
差集: s1 - s2
交集: s1 & s2
对称差分: s1 ^ s2
并集: s1 | s2
s1 = {1, 2, 3}
s2 = {1, 2}
print(s1 - s2) # {3}
print(s1 & s2) # {1, 2}
s1 = {1, 2, 3}
s2 = {1, 2, 4}
print(s1 ^ s2) # {3, 4}, {1, 2, 3, 4} - {1, 2} = {3,4}
print(s1 | s2) # {1, 2, 3, 4}
print(s1.issubset(s2)) # False
print(s1.isdisjoint(s2)) # False
3-4. 拓展: frozenset不可变的集合
s = frozenset({1, 2, 3})
print(s, type(s))
#frozenset({1, 2, 3}) <class 'frozenset'>
练习:
明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性,他先用计算机生成了N个1到1000之间的随机整数(N≤1000),对于其中重复的数字,只保留一个,把其余相同的数去掉,不同的数对应着不同的学生的学号。然后再把这些数从大到小排序,按照排好的顺序去找同学做调查。请你协助明明完成“去重”与“排序”的工作(同一个测试用例里可能会有多组数据,希望大家能正确处理)。
random.randint(1,1000)
li.sort() 排序
import random
n = int(input("输入n:"))
s=set()
for i in range(n):
s.add(random.randint(1,1000))
print(sorted(s,reverse=True))
字典的操作:
- 字典的创建dict
key-value对或者键值对
# key-value对或者键值对
d = {"name":"westos", "age":18, "city":"西安"}
print(d, type(d))
# {'name': 'westos', 'age': 18, 'city': '西安'} <class 'dict'>
d = {}
print(d, type(d))
# {} <class 'dict'>
- 字典的特性
不支持+, * , index, slice(因为集合无序不重复的)
支持in和not in
d = {"name":"westos", "age":18, "city":"西安"}
print('name' in d) # True, 判断是否为所有key值得成员
print("westos" in d) # False
- 字典的常用方法
3-1). 查看
"""
查看所有: keys, values, items
查看局部: d[key], d.get(key), d.get(key, default-value)
"""
d = {"name":"westos", "age":18, "city":"西安"}
print(d.keys()) # 查看字典所有的key值
print(d.values()) # 查看字典所有的value值
print(d.items()) # 查看字典所有的key-value值(item元素)
print(d['name']) # 查看key为name对应的value值
# print(d['province']) # 查看key对应的vlaue值,如果不存在会报错。
print(d.get('province')) # 查看key对应的vlaue值, 如果存在则返回,如果不在在则返回None.
print(d.get('province', "陕西")) # 查看key对应的vlaue值, 如果存在则返回,如果不在在则返回默认值.
"""
输出结果:
dict_keys(['name', 'age', 'city'])
dict_values(['westos', 18, '西安'])
dict_items([('name', 'westos'), ('age', 18), ('city', '西安')])
westos
None
陕西
"""
3-2). 增加和修改
d = {"name":"westos", "age":18}
d['city'] = "西安" # key不存在就添加
print(d) # {'name': 'westos', 'age': 18, 'city': '西安'}
d['city'] = "北京" # key存在则修改value值
print(d) # {'name': 'westos', 'age': 18, 'city': '北京'}
d = {"name":"westos", "age":18}
d.setdefault('city', "西安") # key不存在就添加
print(d) # {'name': 'westos', 'age': 18, 'city': '西安'}
d.setdefault('city', "北京") # key存在,则do nothing
print(d) # {'name': 'westos', 'age': 18, 'city': '西安'}
3-3). 删除
d = {"name":"westos", "age":18}
d.pop('name')
print(d) # {'age': 18}
d = {"name":"westos", "age":18}
del d['name']
print(d) # {'age': 18}
- 遍历字典(for)
d = {"name":"westos", "age":18, "city":"西安"}
# 默认情况下,字典只会遍历key值
for item in d:
print(item)
"""
结果:
name
age
city
"""
# 如果遍历字典的key和value呢?(特别特别重要)
for key,value in d.items(): # [('name', 'westos'), ('age', 18), ('city', '西安')]
print(f"key={key}, value={value}")
"""
key=name, value=westos
key=age, value=18
key=city, value=西安
"""
5 字典的拓展defaultdict
collections.defaultdict类,本身提供了默认值的功能, 默认值可以是整形,列表,集合等.
defaultdict 是 dict 的子类。但它与 dict 最大的区别在于,如果程序试图根据不存在的 key 访问 value,会引发 KeyError 异常;而 defaultdict 提供default_factory 属性,该为不存在的 key 来自动生成生成默认的 value。
from collections import defaultdict
# 默认字典,设置默认value
d = defaultdict(int)
d['views'] += 1
d['transfer'] += 1
print(d)
# defaultdict(<class 'int'>, {'views': 1, 'transfer': 1})
d = defaultdict(list)
d['allow_users'].append('westos')
d['deny_users'].extend(['user1', 'user2'])
print(d)
# defaultdict(<class 'list'>, {'allow_users': ['westos'], 'deny_users': ['user1', 'user2']})
d = defaultdict(set)
d['love_movies'].add("黑客帝国")
d['dislike_movies'].update({'前任3', '电影xxxx'})
print(d)
# defaultdict(<class 'set'>, {'love_movies': {'黑客帝国'}, 'dislike_movies': {'前任3', '电影xxxx'}})
数据类型汇总
- 可变和不可变
- 可变数据类型: list, set, dict
- 不可变数据类型: 数值类型,tuple, str
- 序列(有序和无序)和非序列
有序序列拥有的特性: 索引、切片、连接操作符、重复操作符以及成员操作符等特性。