python 集合（set）和字典（dictionary）的用法解析

2023-08-10 16:04:10

Table of Contents generated with DocToc

ditctaionary and set

ditctaionary and set

hash 介绍

hash是计算机中非常常见一种查找的手法，它可以支持常数时间的insert、remove、find，但是对于findMin、findMax、sort等操作就支持的不是很好，具体是为什么呢；

hash其实是通过key来找value的，可以这样简单的理解为value都被存在一个数组之中，每次你用key计算一下可以得到相应数组的下标，即 index=f（key）是不是一下子就找到元素所在位置了呢！

集合-set

集合（set）是一类容器，元素没有先后顺序，并且元素的值不重复。
集合的字面量用花括号{}
eg：

{1,5,7}
{'apple', 'orange', 'pear', 'banana'}

创建

直接给变量赋值一个集合字面量
fruit = {'apple', 'orange', 'pear', 'banana'}
使用set()创建一个空集合
emp = set()
注：emp = {} #创建一个空字典
使用set()将列表或元组转换成集合
prime = set([1,3,5,7,11])
结果是：
{1, 3, 5, 7, 11}

操作和访问集合的元素

可以用add()和remove()添加和删除集合元素
可以用min()、max()、len()和sum()对集合操作。
集合内的元素是无序的，所以不能像列表那样通过下标来访问集合元素。

用循环实现遍历集合中的各个元素

s = {2,3,5,7,11}
for i in s:
    print(i，end='')
#输出：
#235711

运算符in和not in 用于判断某个元素是否在集合中。

s = {2,3,5,7,11
print(5 in s)
print(4 not in s)
输出：
True
True

子集、超集、相对判断

如果集合s1中的元素，同样都在集合s2中，则称s1为s2的子集，s2为s1的超集。
使用s1.issubset(s2)来判断s1是否为s2的子集。
使用s2.issuperset(s1)来判断s1是否为s2的超集。

s1 = {2,3,5,7}
s2 = {1,2,3,4,5,6,7}
print(s1.issubset(s2))
print(s2.issuperset(s1))
输出：
True
True

使用关系运算符==和!=
- 判断2个集合包含的元素完全相同与否。
使用关系运算符<,<=,>,>=。
- 如果s1是s2的真子集，则s1<s2是True
- 如果s1是s2的子集，则s1<=s2是True
- 如果s1是s2的真超集，则s1>s2是True
- 如果s1是s2的超集，则s1>=s2是True
- 注：s1是s2的真子集的意思是s1是s2的子集，但是s2中至少有一个s1中不存在的元素； s1是s2的真超集的意思是s1是s2的超集，但是s1中至少有一个s2中不存在的元素。
通过集合的函数或运算符进行集合的并集、交集、差集和对称差的集合运算。

运算	函数	运算符	说明
并集	union()	\|	同数学中的并集
交集	intesection()	&	同数学交集
差集	difenrence()	-	s1-s2出现在s1不出现在s2
对称差	symmertric_diference()	^	s1^s2=s1

字典-dictionary （map）

字典是一个用“键”做索引来存储的数据的集合。一个键和它所对应的数据形成字典中的一个条目。字典的key是用来做hash运算的，需要不可变对象，如数字、字符串、元组；可变的对象不可以作为key，如list、dictionary、set

创建字典

用花括号{ } 来表示，每个元素用冒号分隔键和数据。可以用{}或者dict()来创建空字典。

students = {3180101:’张三’, 3180102:’李四’, 3180105:’王五’, 3180110:’赵六’}
d={'math': '0001', 'python': '0002', 'c': '0003'}

d=dict([("math","0001"),("python","0002"),("c","0003")])

d=dict(math="0001",python="0002",c="0003")

字典的基本运算

访问和修改条目
直接用[ ]运算符，用<字典> [键]的形式，访问键所对应的数据。

score = {'张三':78, '李四':92}
print(score['张三'])#访问score中键为'张三'的数据
score['李四'] = 89#把score中键为'李四'的数据修改为89
score['王五'] = 100#score中没有键为‘王五’的元素，则增加一项，键为’王五’,数据为100。
print(score）
输出：
78
{'张三': 78, '李四': 89, '王五': 100}

删除条目
del dictName[key]
如果key不存在，会抛出KeyError异常
遍历字典

# 循环
score = {'张三':78, '李四':92, '王五':89}
for name in score:
    print(name + ':' + str(score[name]))

#用items（）
for key,value in score.items():
   print(key + ':' + str(value))
输出：
张三:78
李四:92
王五:89

字典的大小len()
检测，in 和not in检测key是否在字典中
用==和!=比较2个字典是否相同（键和值都相同）
字典常用函数
|函数|说明|
|:-|:-|
|keys()|返回由全部key组成的序列|
|values()|返回由全部值组成的序列|
|items()|返货一个序列，每一项都是一个tuple，（key，value）|
|clear()|删除所有条目|
|get(key,value)|返回这个键所对应的值,如找不到返回None|
|pop(key)|返回这个键所对应的值，同时删除这个条目|

可变对象和不可变对象

可变对象和不可变对象是Python语言的核心概念。

不可变对象，该对象所指向的内存中的值不能被改变。当改变某个变量时候，由于其所指的值不能被改变，相当于把原来的值复制一份后再改变，这会开辟一个新的地址，变量再指向这个新的地址。
可变对象，该对象所指向的内存中的值可以被改变。变量（准确的说是引用）改变后，实际上是其所指的值直接发生改变，并没有发生复制行为，也没有开辟新的出地址。
不可变数据类型创建不可变对象，可变数据类型创建可变对象
可变类型有：列表、集合、字典
不可变类型有：整数、浮点数、复数、字符串、逻辑量（True False）、元组

不同数据类型对象和逻辑值的变换

数据类型	True	False
整数	非0	0
浮点数	非0	0.0
复数	非0	0+0j
字符串	非空	""
逻辑量	True	False
列表	非空	[]
元组	非空	（）
集合	非空	set（）
字典	非空	{}

应用

set

列表去重

#去重，但不能保证保持原有顺序
mailto = ['cc', 'bbbb', 'afa', 'sss', 'bbbb', 'cc', 'shafa']
addr_to =list(set(mailto))
print(addr_to)
#result ['shafa', 'cc', 'sss', 'afa', 'bbbb']
#排序后保证保持原有顺序
addr_to.sort(key = mailto.index)
print(addr_to)
#result ['cc', 'bbbb', 'afa', 'sss', 'shafa']

找鞍点

n=int(input())
a=[]
for i in range(0,n):
      b=input().split()
      a.insert(i,b)
c=[]
d=[]
for i in range(0,n):
    maxa=max(int(a[i][j]) for j in range(n))
    mina=min(int(a[k][i]) for k in range(0,n))
    c+=[(i,j) for j in range(n) if int(a[i][j])==maxa]
    d+=[(k,i) for k in range(n) if int(a[k][i])==mina]
c=list(set(c)&set(d))
if (c!=[]):
   print(c[0])
else:
   print("NONE")

dictionary

字典替代分支语言

#输入一个1到7的数字，输出对应的星期名的缩写
days={1:"Mon",2:"Tue",3:"Wed",4:"Thu",5:"Fri",6:"Sat",7:"Sun"}
num=int(input())
print(days[num])

result={"+":"x+y","-":"x-y","*":"x*y","/":'''x/y if y!=0   \
        else "divided by zero"'''}
x=int(input())
z=input().strip()
y=int(input())
r=eval(result.get(z))#计算表达式的值
if type(r)!=str:
    print(format(r,'.2f'))
else:
    print(r)

字典计数

eg:1

#输入一行字符，求字符”a”,”b”和”c”出现的次数

diccount={char:0 for char in "abc"}   #字典初始化
s=input()
lst=[char for char in s if  
      ord("a")<=ord(char)<=ord("c")]
for char in lst:
    diccount[char]+=1
print(diccount)

eg2:

#输入一行字符，求每个字符出现的次数
#建字典dicchar,键是字符，值是字符出现的次数。由于不能预知出现哪些字符，所以不能预先初始化字典
#注意字典的get函数：get() 函数返回指定键的值，如果值不在字典中返回默认值。countchar.get(c,0)函数返回键为c的值, 不在字典中返回0。

str=input()
countchar={}

for c in str:
    countchar[c]=countchar.get(c,0)+1
print(countchar)

eg:

#求列表中两数之和等于指定数的下标
'''
Given nums = [2, 11,7, 15], target = 9,
Because nums[0] + nums[1] = 2 + 7 = 9,
return [0, 2].
'''
nums = [2, 6, 11, 15,7,8]
target = 9


hm = dict()
for i in range(len(nums)):
    if nums[i] in hm:
        print(hm[nums[i]], i)
        break
    hm[target - nums[i]] = i
print([2, 6, 11, 15,7,8])
print(hm)

字典列表嵌套

books=[
        {"name":u"C#从入门到精通","price":25.7,"store":u"卓越"},
        {"name":u"ASP.NET高级编程","price":44.5,"store":u"卓越"},
        {"name":u"Python核心编程","price":24.7,"store":u"当当"},
        {"name":u"JavaScript大全","price":45.7,"store":u"当当"},
        {"name":u"Django简明教程","price":26.7,"store":u"新华书店"},
        {"name":u"深入Python","price":55.7,"store":u"新华书店"},
      ]

print(min([item["price"] for item in books ]))
#24.7
books[0]['name']
#C#从入门到精通

字典嵌套

users = {'aeinstein': {'first': 'albert',
                       'last': 'einstein',
                       'location': 'princeton'},
         'mcurie': {'first': 'marie',
                    'last': 'curie',
                    'location': 'paris'},
         }

for username, user_info in users.items():
    print("\nUsername: " + username)
    full_name = user_info['first'] + " " + user_info['last']
    location = user_info['location']

    print("\tFull name: " + full_name.title())
    print("\tLocation: " + location.title())
    '''
Username: aeinstein
Full name: Albert Einstein
Location: Princeton

Username: mcurie
Full name: Marie Curie
Location: Paris
    '''

图和字典

# %% 求图的顶点数，边数，边的总长  空字典{}，空集合 set()
d={"start": {1:1,2:2,3:4},  #第一个点为“start”，一条边指向1，长度为1，一条指向2，长度为2，一条指向3，长度为4
   1:{3:5},
   2:{"end":8,3:78},
   3:{2:4,"end":8},
   "end":{}   }
v=set();     e=set()    ;s=0           #顶点的集合，边点的集合
for key,value in d.items():
    v.add(key)
    if type(value)==dict:
        for key1,value1 in value.items():
            v.add(key1)
            e.add((key,key1))
            s+=value1

print(len(v),len(e),s)
#5 8 110

组装字典

id = "IAD"
location = "Dulles Intl Airport"
max_temp = 32
min_temp = 13
precipitation = 0.4


print("{id:3s} : {location:19s} : {max_temp:3d} / {min_temp:3d} /{precipitation:5.2f}".format(
   id=id, location=location, max_temp=max_temp,
   min_temp=min_temp, precipitation=precipitation))

data = dict(
       id=id, location=location, max_temp=max_temp,
       min_temp=min_temp, precipitation=precipitation
       )
print("{id:3s} : {location:19s} : {max_temp:3d} / {min_temp:3d} /{precipitation:5.2f}".format_map(data))

#IAD : Dulles Intl Airport :  32 /  13 / 0.40
#IAD : Dulles Intl Airport :  32 /  13 / 0.40
#date={'id': 'IAD', 'location': 'Dulles Intl Airport', 'max_temp': 32, 'min_temp': 13, 'precipitation': 0.4}

参考文档

[python官方文档]https://docs.python.org/3.8/library/stdtypes.html#set-types-set-frozenset

注：如有侵权联系作者删帖

码农公寓