Python的集合

集合

1.  集合的定义

  在Python中, 集合是基本数据类型的一种集合类型,它有可变集合set()和不可变集合frozenset()两种。Python中的集合类似列表,但每个元素都必须时独一无二的,且是无序的。

  集合set和集合frozenset的区别如下:

  集合set是可变的,有add(),remove()等方法。由于集合set是可变的,所以它不存在哈希值。基本功能包括关系测试和消除重复元素。集合对象还支持union(联合)、 intersection(交集)、 difference(差集)和sysmmetric difference(对称差集)等数学运算。

  集合set支持 N in set, len(set),和 for N in set。作为一个无序的集合,集合set不记录元素位置或者插入点。因此,集合set不支持 indexing, 或其它类序列的操作。

  集合frozenset()是不可变的,存在哈希值,优点是它可以作为字典的key,也可以作为其它集合的元素。缺点是一旦创建便不能更改,没有add(),remove()方法。

  因此,Python中集合的作用主要是:去重,把一个列表变成集合,就自动去重;关系测试,测试两组数据之间的交集、差集、并集等关系。

2.  集合的操作

  在Python中,集合set的常用操作包括:创建集合set、集合set增加、集合set删除、集合的交集、集合的并集、集合的差集等。

2.1 集合的创建

  在Python中,集合的创建可以使用集合的工厂函数set()和frozenset(),但是,set()创建的集合时可变的,frozenset()创建的集合时不可变的,其语法格式分别如下:

  集合名 = set(集合值)

集合名 = frozenset(集合值)  

  

  (1)创建空集合

  在Python中,当不指定集合的值时,使用工厂函数set()和frozenset()即可创建一个空集合。

  例如,创建空集合。  

  代码:

 a =set()
b = frozenset()
print(a)
print(b)

  运行结果:

 set()
frozenset()

  (2)用set()方法创建集合  

  例如,用set()方法创建一个0到10之间的奇数的集合,并打印出来。

  代码:

 number_odd = []
for number in range(1,11,2):
number_odd.append(number)
number_opp_set =set(number_odd)
print(number_opp_set)

  说明:

  第1行,创建一个空列表。

  第2~3行,用函数range()循环生成0到10之间的奇数,然后增加到空列表中。

  第4行,将列表中的值传给方法set(),生成一个集合。

  运行结果:

 {1, 3, 5, 7, 9}

  以上的代码可以通过列表解析的方式优化为:

  代码1:

 number_opp_set =set(number for number in range(1,11,2))
print(number_opp_set)

  说明:

  因为Python是解释性语言,代码越少,解释花费的时间也少。

  运行结果1:

1 {1, 3, 5, 7, 9} 

 (3)用frozenset()方法创建集合  

  例如,用frozenset()方法创建一个0到10之间的奇数的集合,并打印出来。

  代码:

 number_opp_set_0 =frozenset(number for number in range(1,11,2))
print(number_opp_set_0)

 

  运行结果:

 frozenset({1, 3, 5, 7, 9})

2.2  集合的增加

  在python中,集合的增加有两种常用方法:add()方法和update()方法。

  (1) add()方法

  集合的add()方法是把要传入的元素做为一个整体增加到集合中,即实现单元素增加。

  例如,定义一个0到10的奇数的集合,然后再用add()方法往里面增加一个偶数2和18,然后再打印出来。

  代码:

 number_opp_set =set(number for number in range(1,11,2))
print(number_opp_set)
number_opp_set.add(2)
number_opp_set.add(18)
print(number_opp_set)

  说明:

  第3、4行,都是时使用add()方法分别向集合中增加偶数2和18。

  

  运行结果:

 {1, 3, 5, 7, 9}
{1, 2, 3, 5, 7, 9, 18}

  (2)update()方法

  集合update()方法是把要传入的元素拆分,做为单个个体增加到集合中,即多元素增加。

  例如,定义一个0到10的奇数的集合,然后再用update()方法往里面增加一个偶数2和18,然后再打印出来。

  代码:

 number_opp_set =set(number for number in range(1,11,2))
print(number_opp_set)
number_opp_set.update('')
number_opp_set.update('')
print(number_opp_set)

  说明:

  第3、4行,分别调用update()方法分别向集团中增加偶数2和18.

  运行结果:

 {1, 3, 5, 7, 9}
{1, 3, 5, 7, 9, '', '', ''}

  从以上的运行结果中可知,偶数18倍拆分为1和8分别增加到集合中,并且增加的值都被单引号引起来,这表示增加的是字符窜。这并不是我们需要的结果。

  在Python中,如果调用update()方法向集合中增加两个或多个字符组成的值时,该值需要使用中括号或者花括号括起来,即表示为字典或列表的形式。

  例如,定义一个0到10的奇数的集合,然后再用update()方法往里面增加一个偶数2和18,即奇数19,然后再打印出来。

  代码:

 number_opp_set =set(number for number in range(1,11,2))
print(number_opp_set)
number_opp_set.update('')
number_opp_set.update([''])
number_opp_set.update({''})
print(number_opp_set)

 

  运行结果:

 {1, 3, 5, 7, 9}
{1, 3, 5, 7, 9, '', '', ''}

2.3 集合的删除

  在Python中,集合的删除分为两种,一种是删除集合中的值;一种是删除整个集合。

  (1)删除整个集合

  在Python中,当我们需要删除整个集合中时,可使用del 语句直接删除。

  例如,将1.2.2 中创建的集合删除。

  代码:

 number_opp_set =set(number for number in range(1,11,2))
print("集合删除前:",number_opp_set)
del number_opp_set
print("集合删除后:",number_opp_set)

  说明:

  第2行,使用del语句删除集合number_opp_set。

  运行结果:

 集合删除前: {1, 3, 5, 7, 9}
Traceback (most recent call last):
File "F:/PyProject/s14/day2/test_set.py", line 6, in <module>
print("集合删除后:",number_opp_set)
NameError: name 'number_opp_set' is not defined

  从以上的运行结果可知,使用del语句删除集合时一种永久性的,删除后就集合就不能再被使用。

  (2)删除集合中的值

  在Python中,当我们需要删除集合中的值时,可使用remove()方法、discard()方法及pop()方法。

  注意:remove()方法和discard()方法都能删除指定的集合的值,但如果指定的值在集合中找不到,则会提示错误,而discard()方法不会;pop()方法是随机删除集合中的任意一个值。

  例如,将1.2.2 中增加到集合中的值删除。

  代码:

 number_opp_set =set(number for number in range(1,11,2))
print(number_opp_set)
number_opp_set.update('')
number_opp_set.update([''])
number_opp_set.update({''})
print(number_opp_set)
number_opp_set.remove('')
number_opp_set.discard('')
number_opp_set.pop()
print(number_opp_set)

  说明:

  第7行,调用remove()方法从集合中删除前面增加到集合中的值2,并且remove()中的参数必须用引号引起来,否则Python解释器无法解析,会提示错误。

  第8行,调用discard()方法从集合中删除前面增加到集合中的值18,方法discard()中的参数如果全是数字,不用引号引起来也不会报错,但集合中的值18不会被删除,不用引号引起来,Python解释器解析不到该值。

  运行结果:

 {1, 3, 5, 7, 9}
{1, 3, 5, '', 7, 9, '', ''}
{3, 5, 7, 9, ''}

  从以上的运行结果可知,由于pop()方法是随机删除集合中的任意一个值,所以将原集合中的值1删除了,但增加的值19仍然存在集合中。

2.3 集合的访问

  在Python中,集合的访问主要有两种,一种是访问整个集合,一种的集合的遍历。

  (1)访问整个集合

  在Python中,访问整个集合,可以直接使用。

  例如,创建一个1到10之间的数字组成的偶数的集合,并访问整个集合。

  代码:

 number_even_set =set(number for number in range(2,11,2))
print(number_even_set)

  说明:

  第1行,使用range()函数和for循环,从2开始,依次遍历到10,且步长为2,再用set()方法,将所有遍历过程中满足步长为2的数字创建为一个集合。

  第2行,直接用print打印整个集合。

  运行结果:

 {2, 4, 6, 8, 10}

  (2)访问集合中的每个值

  在Python中,我们可以使用for循环来遍历访问集合中的每个值。

  例如,创建一个1到10之间的数字组成的偶数的集合,并遍历访问集合中的每个值。

  代码:

 number_even_set =set(number for number in range(2,11,2))
print(number_even_set)
for number_evven in number_even_set:
print(number_evven)

  运行结果:

 {2, 4, 6, 8, 10}
2
4
6
8
10

3.  集合的关系测试

  在Python中,集合的关系测试包括:并集、交集、差集等等。

3.1 并集

  集合中,并集也叫合集,即将一个集合和另一个集合合并为一个集合的过程。求并集使用函数union()或者运算符“|”。

  例如,创建一个1到10之间的数字组成的偶数的集合和奇数集合,然后求其并集。

  代码:

 number_opp_set =set(number for number in range(,,))
print(number_opp_set)
number_even_set =set(number for number in range(,,))
print(number_even_set)
print("-----第一种方式:用函数union()求并集-----")
number_set = number_opp_set.union(number_even_set)
print(number_set)
print("-----第二种方式:用运算符'|'求并集-----")
_number_set = number_opp_set | number_even_set
print(_number_set)

 说明:

  第6行,用函数union()将集合number_opp_set和集合number_even_set合并后赋值给变量number_set。

  第7行,用运算符 ‘|’ 将集合number_opp_set和集合number_even_set合并后赋值给变量_number_set。

  

  运行结果:

 {, , , , }
{, , , , }
-----第一种方式:用函数union()求并集-----
{, , , , , , , , , }
-----第二种方式:用运算符'|'求并集-----
{, , , , , , , , , }

  从以上的运行结果可知,求两个集合的并集可以使用函数union()或运算符 ‘|’ ,其结果是一致的。

3.2 交集

  交集就是两个集合中都有的部分,用函数intersection()或运算符 ‘&’求两个集合的交集。

  例如,创建一个1到5的数字组成的集合,再创建一个0到10的奇数组成的集合,然后求其交集。

  代码:

 number_set_a =set(number for number in range(1,6))
print(number_set_a)
number_opp_set =set(number for number in range(1,11,2))
print(number_opp_set)
print("-----第一种方式:intersection()求交集-----")
number_set = number_set_a.intersection(number_opp_set)
print(number_set)
print("-----第二种方式:用运算符 '&'求交集-----")
_number_set = number_set_a & number_opp_set
print(_number_set)

  说明:

  第6行,使用函数intersection()求集合number_set_a和集合number_opp_set的交集,并赋值给变量number_set。

  第9行,使用运算符 ‘&’ 求集合number_set_a和集合number_opp_set的交集,并赋值给变量_number_set。

  运行结果:

 {1, 2, 3, 4, 5}
{1, 3, 5, 7, 9}
-----第一种方式:intersection()求交集-----
{1, 3, 5}
-----第二种方式:用运算符 '&'求交集-----
{1, 3, 5}

  从以上的运行结果可知,通过函数intersection()或运算符 ‘&’ ,都可以求两个集合交集。

3.3 差集

  差集就是在两个集合中,在集合a中有,但集合b中没有的部分,或者集合b中有,但集合a中没有的部分。因此我们可使用函数difference()或运算符 ‘-’ 求差集。

  例如,创建一个1到5的数字组成的集合,再创建一个0到10的奇数组成的集合,然后求其差集。

  代码:

 number_set_a =set(number for number in range(1,6))
print(number_set_a)
number_opp_set =set(number for number in range(1,11,2))
print(number_opp_set)
print("-----第一种方式:difference()求差集-----")
number_set = number_set_a.difference(number_opp_set)
print(number_set)
_number_set = number_opp_set.difference(number_set_a)
print(_number_set)
print("-----第二种方式:用运算符 '-'求差集-----")
_number_set_ = number_set_a- number_opp_set
print(_number_set_)
__number_set__ = number_opp_set - number_set_a
print(__number_set__)

  说明:

  第6行,使用函数difference()求集合number_set_a中有,但集合number_opp_set中没有的部分,并赋值给变量number_set。

  第8行,使用函数difference()求集合number_opp_set中有,但集合number_set_a中没有的部分,并赋值给变量_number_set。

  第11行,使用运算符 '-' 求集合number_set_a中有,但集合number_opp_set中没有的部分,并赋值给变量_number_set_。

  第13行,使用运算符 '-' 求集合number_opp_set中有,但集合number_set_a中没有的部分,并赋值给变量__number_set__。

  运行结果:

 {1, 2, 3, 4, 5}
{1, 3, 5, 7, 9}
-----第一种方式:difference()求差集-----
{2, 4}
{9, 7}
-----第二种方式:用运算符 '-'求差集-----
{2, 4}
{9, 7}

3.4 子集

  判断集合a是否是集合b的子集,使用函数issubset()或运算符 ‘<=’。

  例如,创建一个1到10的数字组成的集合,再创建一个0到10的奇数组成的集合,然后求其子集。

  代码:

 number_set_a =set(number for number in range(1,11))
print(number_set_a)
number_opp_set =set(number for number in range(1,11,2))
print(number_opp_set)
print("-----第一种方式:issubset()求子集-----")
number_set = number_set_a.issubset(number_opp_set)
print(number_set)
_number_set = number_opp_set.issubset(number_set_a)
print(_number_set)
print("-----第二种方式:用运算符 '<='求子集-----")
_number_set_ = number_set_a <= number_opp_set
print(_number_set_)
__number_set__ = number_opp_set <= number_set_a
print(__number_set__)

 说明:

  第6行,用函数issubset()判断集合number_set_a是否是集合number_opp_set的子集,判断结果赋值给变量number_set。

  第8行,用函数issubset()判断集合number_opp_set是否是集合number_set_a的子集,判断结果赋值给变量_number_set。

  第11行,用运算符 '<= ' 判断集合number_set_a是否是集合number_opp_set的子集,判断结果赋值给变量_number_set_。

  第13行,用运算符 '<= ' 判断集合number_opp_set是否是集合number_set_a的子集,判断结果赋值给变量__number_set__。

  运行结果:

 {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
{1, 3, 5, 7, 9}
-----第一种方式:issubset()求子集-----
False
True
-----第二种方式:用运算符 '<='求子集-----
False
True

3.5 父集

  判断集合a是否是集合b的父集,使用函数issuperset()或运算符 '>='。

  例如,创建一个1到10的数字组成的集合,再创建一个0到10的奇数组成的集合,然后求其父集。

  代码:

 number_set_a =set(number for number in range(1,11))
print(number_set_a)
number_opp_set =set(number for number in range(1,11,2))
print(number_opp_set)
print("-----第一种方式:issuperset()求父集-----")
number_set = number_set_a.issuperset(number_opp_set)
print(number_set)
_number_set = number_opp_set.issuperset(number_set_a)
print(_number_set)
print("-----第二种方式:用运算符 '>='求父集-----")
_number_set_ = number_set_a >= number_opp_set
print(_number_set_)
__number_set__ = number_opp_set >= number_set_a
print(__number_set__)

    说明:

  第6行,用函数issuperset()判断集合number_set_a是否是集合number_opp_set的父集,判断结果赋值给变量number_set。

  第8行,用函数issuperset()判断集合number_opp_set是否是集合number_set_a的父集,判断结果赋值给变量_number_set。

  第11行,用运算符 ‘>=’ 判断集合number_set_a是否是集合number_opp_set的父集,判断结果赋值给变量_number_set_。

  第13行,用运算符 ‘>=’ 判断集合number_opp_set是否是集合number_set_a的父集,判断结果赋值给变量__number_set__。

  

运行结果:

 {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
{1, 3, 5, 7, 9}
-----第一种方式:issuperset()求父集-----
True
False
-----第二种方式:用运算符 '>='求父集-----
True
False

3.6 对称差集

  对称差集就是求两个集合中的剔除公共的部分的集合。

  例如,创建一个1到5的数字组成的集合,再创建一个0到10的奇数组成的集合,然后求其对称差集。

  代码:

 number_set_a =set(number for number in range(1,6))
print(number_set_a)
number_opp_set =set(number for number in range(1,11,2))
print(number_opp_set)
print("-----第一种方式:symmetric_difference()求对称差集-----")
number_set = number_set_a.symmetric_difference(number_opp_set)
print(number_set)
_number_set = number_opp_set.symmetric_difference(number_set_a)
print(_number_set)
print("-----第二种方式:用运算符 '^ '求对称差集-----")
_number_set_ = number_set_a ^ number_opp_set
print(_number_set_)
__number_set__ = number_opp_set ^ number_set_a
print(__number_set__)

  说明:  

  第6行,使用函数symmetric_difference()求集合number_set_a和集合number_opp_set的对称差集,并赋值给变量number_set。

  第8行,使用函数symmetric_difference()求集合number_opp_set和集合number_set_a的对称差集,并赋值给变量_number_set。

  第11行,使用运算符 ‘^’ 求集合number_set_a和集合number_opp_set的对称差集,并赋值给变量_number_set_。

  第13行,使用运算符 ‘^’ 求集合number_opp_set和集合number_set_a的对称差集,并赋值给变量__number_set__。

  

  运行结果:

 {1, 2, 3, 4, 5}
{1, 3, 5, 7, 9}
-----第一种方式:symmetric_difference()求对称差集-----
{2, 4, 7, 9}
{2, 4, 7, 9}
-----第二种方式:用运算符 '^ '求对称差集-----
{2, 4, 7, 9}
{2, 4, 7, 9}

    从以上的运行结果可知,求两个集合的对称差集时,哪个集合写在函数中或前后都行,其结果都一样。

上一篇:postgresql 获取刚刚插入的数据主键id


下一篇:javascript设计模式——组合模式