在 Python 中,有四类最常见的内建容器类型:列表(list)、元组(tuple)、字典(dict)、集合(set)。通过单独或是组合使用它们,可以高效的完成很多事情。
Python 是一门高级编程语言,它所提供的内置容器类型,都是经过高度封装和抽象后的结果。和 “链表”、“红黑树”、“哈希表” 这些名字相比,所有 Python 内建类型的名字,都只描述了这个类型的功能特点,其他人完全没法只通过这些名字了解它们的哪怕一丁点内部细节。这是 Python 编程语言的优势之一。相比 C 语言这类更接近计算机底层的编程语言,Python 重新设计并实现了对编程者更友好的内置容器类型,屏蔽掉了内存管理等额外工作。为我们提供了更好的开发体验。
列表的特性:
下面是元组和列表的几个区别。
The key difference is that tuples are immutable. This means that you cannot change the values in a tuple once you have created it.
最重要的区别:元组是不可变的,而列表是可变的。
下面两点是元组的优点。
a = tuple(range(1000))
b = list(range(1000))
print(a.__sizeof__()) # 8024
print(b.__sizeof__()) # 9088
Due to the smaller size of a tuple operation, it becomes a bit faster, but not that much to mention about until you have a huge number of elements.
由于元组支持的操作比列表小, 所以元组会比列表稍稍快上那么一丢丢。但是除非你有巨量的数据要去处理,否者这一点不需要特别强调。
You can’t use list as a dictionary identifier.
你不能将列表当作字典的 key,而元组可以(因为元组是不可变的)。
a = (1,2)
b = [1,2]
c = {a: 1} # OK
c = {b: 1} # Error (TypeError: unhashable type: 'list')
下面是字典的几个特点。
无论 dict 有 10 个元素还是 10 万个元素,查找速度都一样。而 list 的查找速度随着元素增加而逐渐下降。不过 dict 的查找速度快不是没有代价的,dict 的缺点是占用内存大,还会浪费很多内容,list 正好相反,占用内存小,但是查找速度慢。由于 dict 是按 key 查找,所以,在一个 dict 中,key 不能重复。
这一点和 list 不一样。
当我们打印下面这个 dict 会得到:
d = {
'Adam': 95,
'Lisa': 85,
'Bart': 59
}
print(d)
{'Lisa': 85, 'Adam': 95, 'Bart': 59}
打印的顺序不一定是我们创建时的顺序,而且,不同的机器打印的顺序都可能不同,这说明dict 内部是无序的,不能用 dict 存储有序的集合。
Python 的基本类型如字符串、整数、浮点数都是不可变的,都可以作为 key。但是 list 是可变的,就不能作为 key。不可变这个限制仅作用于 key,value 是否可变是无所谓的:
{
'123': [1, 2, 3], # key 是 str,value是list
123: '123', # key 是 int,value 是 str
('a', 'b'): True # key 是 tuple,并且tuple的每个元素都是不可变对象,value是 boolean
}
最常用的 key 还是字符串,因为用起来最方便。
dict 的作用是建立一组 key 和一组 value 的映射关系,dict 的 key 是不能重复的。有的时候,我们只想要 dict 的 key,不关心 key 对应的 value,目的就是保证这个集合的元素不会重复,这时,set 就派上用场了。set 持有一系列元素,这一点和 list 很像,但是 set 的元素没有重复,而且是无序的,这点和 dict 的 key 很像。
set 的特点: