看两个例子:
a = 1
def fun(a):
a = 2
fun(a)
print(a) # 1
所有的变量都可以理解为内存中一个对象的“引用”,或者,也可以看似 c 中 void* 的感觉。
通过 id 来看引用 a 的内存地址可以比较理解:
a = 1
def fun(a):
print("func_in",id(a)) # func_in 41322472
a = 2
print("re-point",id(a), id(2)) # re-point 41322448 41322448
print("func_out",id(a), id(1)) # func_out 41322472 41322472
fun(a)
print(a) # 1
注:具体的值在不同PC上运行时可能会不同。
可以看到,在执行完 a=2 之后,a 引用中保存的值,即内存地址发生变化,由原来 1 对象的所在的地址变成了 2 这个实体对象的内存地址。
而第2个例子 a 引用保存的内存值就不会发生变化:
a = []
def fun(a):
print("func_in",id(a)) # func_in 53629256
a.append(1)
print("func_out",id(a)) # func_out 53629256
fun(a)
print(a) # [1]
这里记住的是类型是属于对象的,而不是变量。而对象有两种,“可更改”(mutable)与“不可更改”(immutable)对象。在Python中,strings、tuples、numbers是不可更改的对象,而 list、dict、set 等则是可以更改的对象。(这就是这个问题的重点)
当一个引用传递给函数的时候,函数自动复制一份引用,这个函数里的引用和外边的引用没有半毛关系了。所以第一个例子里函数把引用指向了一个不可变对象,当函数返回的时候,外面的引用没半毛感觉。而第二个例子就不一样了,函数内的引用指向的是可变对象,对它的操作就和定位了指针地址一样,在内存里进行修改。