Python 中的闭包不是一个一说就能明白的概念,但是随着你往学习的深入,无论如何你都需要去了解这么一个东西。
闭包的概念
我们尝试从概念上去理解一下闭包。
在一些语言中,在函数中可以(嵌套)定义另一个函数时,如果内部的函数引用了外部的函数的变量,则可能产生闭包。闭包可以用来在一个函数与一组“私有”变量之间创建关联关系。在给定函数被多次调用的过程中,这些私有变量能够保持其持久性。 —— 维基百科
用比较容易懂的人话说,就是当某个函数被当成对象返回时,夹带了外部变量,就形成了一个闭包。看例子。
1
2
3
4
5
6
7
def make_printer(msg):
def printer():
print msg # 夹带私货(外部变量)
return printer # 返回的是函数,带私货的函数
printer = make_printer('Foo!')
printer()
支持将函数当成对象使用的编程语言,一般都支持闭包。比如 Python, JavaScript。
如何理解闭包
闭包存在有什么意义呢?为什么需要闭包?
我个人认为,闭包存在的意义就是它夹带了外部变量(私货),如果它不夹带私货,它和普通的函数就没有任何区别。同一个的函数夹带了不同的私货,就实现了不同的功能。其实你也可以这么理解,闭包和面向接口编程的概念很像,可以把闭包理解成轻量级的接口封装。
接口定义了一套对方法签名的约束规则。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
def tag(tag_name):
def add_tag(content):
return "<{0}>{1}</{0}>".format(tag_name, content)
return add_tag
content = 'Hello'
add_tag = tag('a')
print add_tag(content)
# <a>Hello</a>
add_tag = tag('b')
print add_tag(content)
# <b>Hello</b>
在这个例子里,我们想要一个给content
加tag
的功能,但是具体的tag_name
是什么样子的要根据实际需求来定,对外部调用的接口已经确定,就是add_tag(content)
。如果按照面向接口方式实现,我们会先把add_tag
写成接口,指定其参数和返回类型,然后分别去实现 a 和 b 的add_tag
。
但是在闭包的概念中,add_tag
就是一个函数,它需要tag_name
和content
两个参数,只不过tag_name
这个参数是打包带走的。所以一开始时就可以告诉我怎么打包,然后带走就行。
上面的例子不太生动,其实在我们生活和工作中,闭包的概念也很常见。比如说手机拨号,你只关心电话打给谁,而不会去纠结每个品牌的手机是怎么实现的,用到了哪些模块。再比如去餐馆吃饭,你只要付钱就可以享受到服务,你并不知道那桌饭菜用了多少地沟油。这些都可以看成闭包,返回来的是一些功能或者服务(打电话,用餐),但是这些功能使用了外部变量(天线,地沟油等等)。
你也可以把一个类实例看成闭包,当你在构造这个类时,使用了不同的参数,这些参数就是闭包里的包,这个类对外提供的方法就是闭包的功能。但是类远远大于闭包,因为闭包只是一个可以执行的函数,但是类实例则有可能提供很多方法。
何时使用闭包
其实闭包在 Python 中很常见,只不过你没特别注意这就是一个闭包。比如 Python 中的装饰器 Decorator,假如你需要写一个带参数的装饰器,那么一般都会生成闭包。
为什么?因为 Python 的装饰器是一个固定的函数接口形式。它要求你的装饰器函数(或装饰器类)必须接受一个函数并返回一个函数:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# how to define
def wrapper(func1): # 接受一个callable对象
return func2 # 返回一个对象,一般为函数
# how to use
def target_func(args): # 目标函数
pass
# 调用方式一,直接包裹
result = wrapper(target_func)(args)
# 调用方式二,使用@语法,等同于方式一
@wrapper
def target_func(args):
pass
result = target_func()
那么如果你的装饰器如果带参数呢?那么你就需要在原来的装饰器上再包一层,用于接收这些参数。这些参数(私货)传递到内层的装饰器里后,闭包就形成了。所以说当你的装饰器需要自定义参数时,一般都会形成闭包。(类装饰器例外)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
def html_tags(tag_name):
def wrapper_(func):
def wrapper(*args, **kwargs):
content = func(*args, **kwargs)
return "<{tag}>{content}</{tag}>".format(tag=tag_name, content=content)
return wrapper
return wrapper_
@html_tags('b')
def hello(name='Toby'):
return 'Hello {}!'.format(name)
# 不用@的写法如下
# hello = html_tag('b')(hello)
# html_tag('b') 是一个闭包,它接受一个函数,并返回一个函数
print hello() # <b>Hello Toby!</b>
print hello('world') # <b>Hello world!</b>
关于装饰器的更深入剖析,可以看我写的另外一篇博客。
再深入一点
其实也不必太深入,理解这上面的概念,很多看起来头疼的代码也不过如此。
下面让我们来了解一下闭包的包到底长什么样子。其实闭包函数相对与普通函数会多出一个__closure__
的属性,里面定义了一个元组用于存放所有的cell
对象,每个cell
对象一一保存了这个闭包中所有的外部变量。
1
2
3
4
5
6
7
8
9
10
11
12
13
>>> def make_printer(msg1, msg2):
def printer():
print msg1, msg2
return printer
>>> printer = make_printer('Foo', 'Bar') # 形成闭包
>>> printer.__closure__ # 返回cell元组
(<cell at 0x03A10930: str object at 0x039DA218>, <cell at 0x03A10910: str object at 0x039DA488>)
>>> printer.__closure__[0].cell_contents # 第一个外部变量
'Foo'
>>> printer.__closure__[1].cell_contents # 第二个外部变量
'Bar'
原理就是这么简单。
参考链接
- https://www.the5fire.com/closure-in-python.html
- http://stackoverflow.com/questions/4020419/why-arent-python-nested-functions-called-closures