Python 中的 lru_cache 缓存装饰器

2020-10-10 Python

Python官方文档在介绍lru_cache时，举的例子就是斐波那契数列。

不用再介绍什么是斐波那契数列了吧，直接上代码：

def fib(x):
    if x <= 2:
        return x
    return fib(x-1) + fib(x-2)

很明显这是一个递归函数，要计算fib(3)，就要计算fib(2) + fib(1)，同理，要计算fib(4)，就要计算fib(3) + fib(2)。

那么就会发现，如果你要计算一个比较大的斐波那契数（比如fib(100)），那么较小的斐波那契数就要重复计算很多次（比如fib(3)、fib(4)、fib(5)等等），从而消耗很多的时间。

lru_cache装饰器的作用，就是让该函数“记住”之前代入某参数后运行返回的结果。之前计算过fib(3)，那么下次再计算fib(3)时就不用再走计算的过程了，直接返回结果。

该装饰器的用法很简单：

from functools import lru_cache

@lru_cache()
def fib(x):
    if x <= 2:
        return x
    return fib(x-1) + fib(x-2)

由于lru_cache本质上是个装饰器工厂函数，所以需要加括号，让它返回一个装饰器函数。

lru_cache可以接受两个可选参数：

lru_cache虽然很强大，但也有一些局限性，举个例子：

from functools import lru_cache
from time import sleep

@lru_cache()
def foo(x, y):
    sleep(x)
    print(y)

以上这个例子中定义的foo函数作用非常简单：阻塞x秒，再打印参数y。

假设我们第一次执行foo(5, "5")，那么该函数会乖乖地休息5秒，然后打印一个5。

但如果我们第二次执行foo(5, "5")，那么结果（None）将立即返回，既没有阻塞也没有打印。

这也是我刚才所提到的：lru_cache只关注被装饰函数返回的结果，并不关注被装饰函数的执行过程，当lru_cache从缓存中取出执行结果时，被装饰的函数并没有被真正执行。

另外，一旦函数被lru_cache装饰之后，就不能使用不可哈希的参数了（比如列表、字典、集合），以上这个例子，尝试调用foo(5, [1, 2])会抛出TypeError异常，投机取巧使用foo(5, (1, [2, 3]))也是不行的。

总而言之，lru_cache的这些局限性决定了它不是想用就用的。

Pzqqt's Blog