在学习Python过程中总感觉有点糊涂,好多书把一些概念解释得不清不楚,甚至用一些生活上的例子来解释这些概念,初看起来似乎明白,一深究便感觉啥也没说。对于真正要学习的人来说,这样的例子实在糟糕。我试图用最接近本质的描述来解释这些概念,希望对你有所帮助。如果理解不准确,请指出来!
1,变量
我因为以前是从汇编,C语言转过来的,就以为Python的变量同C语言中的含义一样,是按照定义时的类型分配相应的内存空间并存储数据的。
Python中变量显然不是这个意思,可能只是一个习惯叫法,我猜‘’变量‘’其实是指一个对象的名字而已,程序员用这个名字去引用对象。所以严格说来Python没有变量,有的只是将名字绑定在对象上(有点像是对象的指针)。而这个名字放在一个字典里,再加上一些查找机制就形成了所谓的命名空间。
2,对象与名字的绑定
x=1
也许你会脱口而出它的含义 -- “设置变量x的值为1”。
对Python来说,这就不严谨了。其实这一赋值语句包含了python中的三个重要概念:名字、绑定和对象。
python对赋值语句作出了自己的定义:
“赋值语句是用来将名字绑定(或重新绑定)到某个对象的操作,而且它也可用来修改可变对象的属性或对象中所包含的成员。”
果真没有提道啥变量。
名字绑定到对象这个概念在python中随处可见,可以说是python的最基本而且最重要的概念之一。如果没有很好理解这一点,一些意想不到的结果就会在您的代码中悄然出现。
3,对象
“万物皆对象”(Everything is object),这是python这种面向对象语言所倡导的理念。在我们熟悉的C++中,1只是一个整型数,而不是一个对象。但在python中,1却是一个实实在在的对象,您可以用dir(1)来显示它的属性。
在python中,所有对象都有下面三个特征:
* 唯一的标识码(identity)
* 类型
* 内容(或称为值)
这就是前面提到的1这个对象的标识码,也就是它在内存中的地址。
对象[1,2,3]存在24302776开始的地址块中。x是它的名字,y是另外一个名字。他们绑定在对象[1,2,3]上。程序中用到x或y实际上是对对象[1,2,3]的引用。
与对象的标识码类似,对象的类型也是不可更改的。可以用内建函数type()取得对象的类型。
有的对象的值是可以改变的,这类对象叫作可变对象;而另外一些对象在创建后其值是不可改变的(如1这个对象),这类对象叫作恒定对象。对象的可变性是由它的类型决定的,比如数值型(number)、字符串型(string)以及序列型(tuple)的对象是恒定对象;而字典型(dictionary)和列表型(list)的对象是可变对象。
除了上面提到的三个特征外,一个对象可能:
* 没有或者拥有多个方法
* 没有或者有多个名字
4,名字
名字是对一个对象的称呼,一个对象可以只有一个名字,也可以没有名字或取多个名字。但对象自己却不知道有多少名字,叫什么,只有名字本身知道它所指向的是个什么对象。给对象取一个名字的操作叫作命名,python将赋值语句认为是一个命名操作(或者称为名字绑定)。
名字在一定的名字空间内有效,不能在同一个名字空间内有两个或更多的对象取同一名字。
让我们再来看看本篇的第一个例子:
x = 1。在python中,它有如下两个含义:
* 创建一个值为1的整型对象
* "x"是指向该整型对象的名字(而且它是一个引用)
5,绑定
如上所讲的,绑定就是将一个对象与一个名字联系起来。更确切地讲,就是增加该对象的引用计数。众所周知,C++中一大问题就是内存泄漏 -- 即动态分配的内存没有能够回收,而解决这一问题的利器之一就是引用计数。python就采用了这一技术实现其垃圾回收机制。
python中的所有对象都有引用计数。
x=x+1
* 这创建了一个新的对象,其值为x+1。
* "x"这个名字指向了该新建的对象,该对象的引用计数加一,而"x"以前所指向的老对象的引用计数减一。
* "x"所指向的老对象的值并没有改变。
* 这就是为什么在python中没有++、--这样的单目运算符的一个原因。
7, 引用计数
对象的引用计数在下列情况下会增加:
* 赋值操作
* 在一个容器(列表,序列,字典等等)中包含该对象
对象的引用计数在下列情况下会减少:
* 离开了当前的名字空间(该名字空间中的本地名字都会被销毁)
* 对象的一个名字被绑定到另外一个对象
* 对象从包含它的容器中移除
* 名字被显示地用del销毁(如:del x)
当对象的引用计数降到0后,该对象就会被销毁,其所占的内存被收回
例7.1:
>>>x= [1,2,3]
>>>y= x
>>> x[0] = 100
>>> print(y)
[100, 2, 3]
>>> print(x)
[100, 2, 3]
#通过x修改对象[1,2,3],y也照样能看到。
>>>x= [1,2,3]
>>>x
[1, 2, 3]
>>>y
[1, 2, 3]
>>>x = [2,4,6]#新创建对象,并赋给x
>>>y
[1, 2, 3]#并没改变
例7.2:
>>>b = [{'k':1}]*4
>>>b
[{'k': 1}, {'k': 1}, {'k': 1}, {'k': 1}]
>>>b[0]['k']=100
>>>b
[{'k': 100}, {'k': 100}, {'k': 100}, {'k': 100}]
例7.3:
>>>b = [{'k':1}]+[{'k':1}]+[{'k':1}]+[{'k':1}]
>>>b
[{'k': 1}, {'k': 1}, {'k': 1}, {'k': 1}]
>>>b[0]['k']=100
>>>b
[{'k':100}, {'k': 1}, {'k': 1}, {'k': 1}]
注解:在有的python书中讲到乘法符号(*)就相当于几个加法的重复,即认为例7.2应该与7.3的结果一致。
其实不然。例7.2中的b这个列表中的每一个元素{'k': 1}其实都是同一个对象,可以用id(b[n])进行验证。
>>>id(b[0])
20166416
>>>id(b[1])
20166416
>>>id(b[2])
20166416
不过对于恒定对象而言,“*”和连续加法的效果一样。比如,b=[1] * 4 就等同于 b=[1]+[1]+[1]+[1]。
8. 函数的传参问题
函数的参数传递也是一个名字与对象的绑定过程,而且是将对象绑定到另外一个名字空间(即函数体内部的名字空间)。python对赋值语句的独特看法又会对函数的传递造成什么影响呢?
8.1 传值?传址?
在学习C++的时候我们都知道有两种参数传递方式:传值和传址。而在python中所有的参数传递都是引用传递(pass reference),也就是传址。这是由于名字是对象的一个引用这一python的特性而自然得来的,在函数体内部对某一外部可变对象作了修改肯定会将其改变带到函数以外。让我们来看看下面这个例子:
例8.1
>>>a = [1, 2, 3]
>>>def foo(par):
par[1] = 10
>>> print(a)
[1, 10, 3]
因此,在python中,我们应该抛开传递参数这种概念,时刻牢记函数的调用参数是将对象用函数名字空间的名字绑定。在函数中,不过是用了函数名字空间的名字,但还是对这同一个对象进行操作。
8.2 缺省参数
使用缺省参数,是我们喜爱的一种作法。这可以在调用该函数时节省不少的击键次数,而且代码也显得更加简洁。更重要的是它从某种意义上体现了这个函数设计的初衷。
但是python中的缺省参数,却隐藏着一个玄机,初学者肯定会在上面栽跟头,而且这个错误非常隐秘。先看看下面这个例子:
例8.2
>>>deffoo(par=[]):
par.append(0)
print(par)
>>>foo()
[0]
>>>foo()
[0, 0]
出了什么问题?这个参数par好像类似与C中的静态变量,累计了以前的结果。是这样吗?当然不是,这都是“对象、名字、绑定”这些思想惹的“祸”。“万物皆对象”,还记得吗?这里,函数foo当然也是一个对象,可以称之为函数对象(与一般的对象没什么不同)。先来看看这个对象有些什么属性。
>>> dir(foo)
['__annotations__', '__call__', '__class__', '__closure__', '__code__', '__defaults__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__get__', '__getattribute__', '__globals__', '__gt__', '__hash__', '__init__', '__kwdefaults__', '__le__', '__lt__', '__module__', '__name__', '__ne__', '__new__', '__qualname__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__']
单从名字上看,'__defaults__'很可能与缺省参数有关,看看它的值
>>>foo.__defaults__
([0, 0],)
>>>foo()# 第三次调用[0, 0, 0]
>>>foo.__defaults__
([0, 0, 0],)
果不其然,就是这个序列对象(tuple)包含了所有的缺省参数。验证一下:
>>>deffooM(par1, def1=1, def2=[], def3='str'):# 定义一个有多个缺省参数的函数
def2.append(0)
print(par1, def1, def2, def3)
>>>fooM.__defaults__
(1, [], 'str')
在函数定义中有几个缺省参数,__defaults__中就会包括几个对象,暂且称之为缺省参数对象(如上列中的1,[]和'str')。这些缺省参数对象的生命周期与函数对象相同,从函数使用def定义开始,直到其消亡(如用del)。所以即便是在这些函数没有被调用的时候,但只要定义了,缺省参数对象就会一直存在。
前面讲过,函数调用的过程就是对象在另外一个名字空间的绑定过程。当在每次函数调用时,如果没有传递任何参数给这个缺省参数,那么这个缺省参数的名字就会绑定到在__defaults__中一个对应的缺省参数对象上。
>>>fooM(2)
2 1 [0] str
函数fooM内的名字def1就会绑定到func_defaults中的第一个对象,def2绑定到第二个,def3则是第三个。
所以我们看到在函数foo中出现的累加现象,就是由于par绑定到缺省参数对象上,而且它是一个可变对象(列表),par.append(0)就会每次改变这个缺省参数对象的内容。
将函数foo改进一下,可能会更容易帮助理解:
>>>deffoo(par=[]):
print(id(par))# 查看该对象的标识码
par.append(0)
print(par)
>>>foo.__defaults__# 缺省参数对象的初始值
([],)
>>>id(foo.__defaults__ [0])# 第一个缺省参数对象的标识码
24387016
>>>foo()
24387016# 证明par绑定的对象就是第一个缺省参数对象
[0]
>>>foo()
24387016# 依旧绑定到第一个缺省参数对象
[0, 0]# 该对象的值发生了变化
24395904#名字par所绑定的对象与外部名字b所绑定的是同一个对象
[1, 0]
>>>foo.__defaults__
([0, 0],)#缺省参数对象还在那里,而且值并没有发生变化
>>>foo()#名字par又绑定到缺省参数对象上
为了预防此类“问题”的发生,采用下列方法:
>>>deffoo(par=[]):
ifparis None: par = []
par.append(0)
print(par)
使用None作为哨兵,以判断是否有参数传入,如果没有,就新创建一个新的列表对象,而不是绑定到缺省参数对象上.
总结:
* 赋值语句:
(1) 创建了对象(=右边).(2) 起了个名字(左边=)并放在命名空间. (3) 名字绑 定到对象.
* 函数的传参:就是把要使用的对象(在函数外)绑定到函数内部的名字上。
准确理解—与曾工一块学习
领取专属 10元无门槛券
私享最新 技术干货