这一篇教程,我们来了解Python中的第三种数据结构–集合(set)。
1、创建集合
集合的创建不同于前两种数据结构。
集合通过set(iterable)方法创建,参数iterable为可迭代对象。
示例代码:
s1 = set('好好学习天天想上') # 将字符串分解为单个字符,作为集合的元素创建集合s2 = set(('好好', '学习', '天天', '想上')) # 将元组分解为单个元素,作为集合元素创建集合s3 = set(['好好', '学习', '天天', '想上']) # 将列表分解为单个元素,作为集合元素创建集合print (s1) # 显示输出结果为:{'好', '习', '上', '天', '想', '学'}print (s2) # 显示输出结果为:{'好好', '想上', '学习', '天天'}print (s3) # 显示输出结果为:{'好好', '想上', '学习', '天天'}
通过上方示例,大家能够看出:
集合可以通过可迭代对象(字符串、元组、列表等)进行创建;
集合中的元素不可重复;
集合中的元素无序排列。
2、添加元素
集合添加元素的方法有两种。
添加单个元素:使用add(element)函数,参数element为集合允许添加的元素(例如数字、字符串、元组等)。
添加多个元素:使用update(iterable)函数,参数iterable为可迭代对象。
示例代码:
# 创建集合s1 = set('123')s2 = set('123')s3 = set('abc')# 添加单个元素s1.add('4')# 添加多个元素s2.update(['4','5','6']) # 添加列表到集合,列表元素会被分解为单个元素后添加到集合s3.update('de') # 添加字符串到集合,字符串会被分解为单个元素后添加到集合# 显示输出print (s1) # 显示输出结果为:{'4', '3', '1', '2'}print (s2) # 显示输出结果为:{'4', '2', '6', '5', '3', '1'}print (s3) # 显示输出结果为:{'c', 'b', 'd', 'e', 'a'}#注意:因为集合元素是无序的,大家在测试以上代码时,显示输出的结果与上方结果,可能在顺序上不一致。
3、删除元素
集合删除元素的方法有两种。
第一种:使用remove(element)方法删除指定元素,参数element为需要删除的元素。
第二种:使用discard(element)方法删除指定元素,参数element为需要删除的元素。
示例代码:
# 创建集合s1 = set(['Python','Java','C','C++','C#'])s2 = set(['Python','Java','C','C++','C#'])# 删除元素s1.remove('C++')s2.discard('C++')# 显示输出print (s1) # 显示输出结果为:{'C', 'Python', 'Java', 'C#'}print (s2) # 显示输出结果为:{'C', 'Python', 'Java', 'C#'}
从上方示例中,大家能够看到remove()和discard()的作用是一样的。
不过,这两个方法是有区别的。
当集合中不存在这两个方法参数中填入的元素时,remove()方法会抛出异常,而discard()方法则没有任何影响。
4、取出元素
集合支持pop()方法取出元素。
示例代码:
# 创建集合s = set(['Python','Java','C','C++','C#'])# 显示输出print (s) # 显示输出结果为:{'Python', 'C#', 'C++', 'Java', 'C'}print (s.pop()) # 取出集合元素,显示输出结果为:Pythonprint (s) # 显示输出结果为:{'C#', 'C++', 'Java', 'C'}
5、清空集合
集合支持clear()方法进行清空。
示例代码:
# 创建集合s = set(['Python','Java','C','C++','C#'])# 清空集合s.clear() # 显示输出print (s) # 显示输出结果为:set()
6、交集/并集/补集/差集
首先我们来看张图,理解交集、并集、补集、差集的概念。
假设有集合A和B。
交集:A和B中相同部分的内容,。
并集:A和B去重后的全部内容,。
补集:A去除与B相交部分后的内容,。
差集:A和B不相交部分的全部内容,。
示例代码:
# 创建集合s1 = set('Python')s2 = set('PyCharm')# 交集操作:获取两个集合中共有元素。print (s1 & s2) # 显示输出结果为:{'y', 'P', 'h'}print (s1.intersection(s2)) # 显示输出结果为:{'y', 'P', 'h'}# 并集操作:获取两个集合去除重复元素后的全部元素。print (s1 s2) # 显示输出结果为:{'y', 'a', 'C', 'o', 'P', 'n', 't', 'm', 'r', 'h'}print (s1.union(s2)) # 显示输出结果为:{'y', 'a', 'C', 'o', 'P', 'n', 't', 'm', 'r', 'h'}# 补集操作:获取当前集合去除与另一集合交集元素后的全部元素。print (s1 - s2) # 显示输出结果为:{'o', 't', 'n'}print (s1.difference(s2)) # 显示输出结果为:{'o', 't', 'n'}print (s2 - s1) # 显示输出结果为:{'m', 'a', 'r', 'C'}print (s2.difference(s1)) # 显示输出结果为:{'m', 'a', 'r', 'C'}# 差集操作:获取两个集合去除交集元素后的全部元素。print (s1 ^ s2) # 显示输出结果为:{'o', 't', 'm', 'a', 'r', 'n', 'C'}print (s1.symmetric_difference(s2)) # 显示输出结果为:{'o', 't', 'm', 'a', 'r', 'n', 'C'}
以上操作中,对集合本身内容并无影响,大家可以在执行以上代码后,继续显示输出s1和s2的内容,能够看到没有任何变化。
接下来,我们再来看几个方法,这些方法会改变集合内容。
第一种:difference_update(set) 函数,能够将当前集合和指定集合进行补集运算,并将当前集合内容更新为运算结果。
示例代码:
s1=set('1234')s2=set('456')s1.difference(s2) # 该操作对s1内容无影响print (s1) # s1无变化,显示输出结果为:{'3', '4', '2', '1'}s1.difference_update(s2) # 更新集合s1的内容为s1-s2后的结果print (s1) # s1内容被更新,显示输出结果为:{'3', '2', '1'}
第二种:intersection_update(set) 函数,能够将当前集合和指定集合进行交集运算,并将当前集合内容更新为运算结果。
示例代码:
s1=set('1234')s2=set('456')s1.intersection_update(s2) # 更新集合s1的内容为s1 & s2后的结果print (s1) # s1内容被更新,显示输出结果为:{'4'}
第三种:symmetric_difference_update(set) 函数,能够将当前集合和指定集合进行差集运算,并将当前集合内容更新为运算结果。
示例代码:
s1 = set('1234')s2 = set('456')s1.symmetric_difference_update(s2) # 更新集合s1的内容为s1 ^ s2后的结果print(s1) # s1内容被更新,显示输出结果为:{'6', '3', '2', '5', '1'}
7、成员关系
Python中提供了一些方法,让我们能够判断一个集合中是否包含某一元素;
也可以判断一个集合是否另一个集合的子集或超集。
还可以判断一个集合与另一个集合是否没有交集。
在之前我们接触过“in”这操作符,可以用来判断操作符前方的值是否被后方的序列包含(成员关系)。
另外,我们还可以使用“not in”,判断操作符前方的值是否未被后方的序列包含(非成员关系)。
在集合中,我们同样可以使用这两个操作符。
另外,我们还可以通过以下方法,判断一个集合是否另外一个集合的子集或超集以及没有交集。
isdisjoint(set):可以判断集合是否与指定集合不存在交集,参数set为集合;如果成立返回结果为True,否则为False。
issubset(set):可以判断集合是否指定集合的子集,参数set为集合;如果成立返回结果为True,否则为False。
issuperset(set):可以判断集合是否指定集合的超集,参数set为集合;如果成立返回结果为True,否则为False。
示例代码:
s1 = set('好好学习')s2 = set('天天想上')s3 = set('好好学习天天想上')print ('好' in s1) # 显示输出结果为:Trueprint ('好' not in s2) # 显示输出结果为:Trueprint (s1.isdisjoint(s2)) # 显示输出结果为:Trueprint (s1.issubset(s3)) # 显示输出结果为:Trueprint (s3.issuperset(s1)) # 显示输出结果为:True
8、复制集合
使用copy()方法能够对集合进行复制。
大家通过下方代码即可理解复制的用途。
示例代码:
a = set('小楼一夜听春语') # 创建集合存入变量ab = a # 创建变量b引用变量a的集合c = a.copy() # 创建变量c复制变量a的值print (a) # 显示输出结果为:{'春', '夜', '楼', '听', '语', '小', '一'}print (b) # 显示输出结果为:{'春', '夜', '楼', '听', '语', '小', '一'}print (c) # 显示输出结果为:{'春', '夜', '楼', '听', '语', '小', '一'}a.remove('一') # 删除变量a中集合的一个元素print (a) # 变量a发生改变,显示输出结果为:{'春', '夜', '楼', '听', '语', '小'}print (b) # 变量b因为引用变量a,同样发生改变,显示输出结果为:{'春', '夜', '楼', '听', '语', '小'}print (c) # 变量c没有改变,显示输出结果为:{'春', '夜', '楼', '听', '语', '小', '一'}
如果还不能够理解,我们可以看下面这张图。
代码中,b = a实际上是将b指向了a的内容,所以当a的内容发生变化时,b同步发生了变化。
而c = a.copy()则是将a的内容真正进行了复制,不再受a的变化影响。
9、其他
集合也支持len()方法进行元素数量的获取,也支持max()方法和min方法获取集合中的最大元素与最小元素,在此不再赘述。
本节知识点:
数据结构(集合)的相关操作。
本节英文单词与中文释义:
1、set:集合/设置
2、add:添加
3、update:更新
4、discard:丢弃
5、intersection:相交
6、union:联合
7、difference:差数
8、symmetric:对称
9、in:在…里面
10、not:不/不是
11、disjoint:不相交
12、subset:子集
13、superset:父集/超集
14、copy:复制
领取专属 10元无门槛券
私享最新 技术干货