后悔没早知道这些Python特性

最新推荐文章于 2025-11-25 06:28:29 发布

转载最新推荐文章于 2025-11-25 06:28:29 发布 · 477 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：https://t.csdnimg.cn/mnkz

本文通过实例探讨Python的装饰器应用及OrderedDict的高效使用，旨在帮助开发者掌握Python的高级特性，提升代码质量和效率。

640?wx_fmt=gif

写 Python 也好几年时间了。讲道理，在工作中大家肯定遇到过这样的场景：

640?wx_fmt=jpeg

这个故事告诉我们什么？先造轮子再去 GitHub？还是提高下 GitHub 搜索技巧？

都不是！

实际上，在日常的工作中，我们很多需求，无论是常见的、还是不常见的，Python 都为我们提供了一些独特的解决方案，既不需要自己造轮子，也不需要引入新的依赖（引入新的依赖势必会增加项目的复杂度）。

但是 Python 有太多功能和特性被我们忽略了，导致我们在遇到问题的时候，没法第一时间作出良好的决策。

所以，干脆来一起扫清这些被我们忽略的 Python 死角。

装饰器的妙用

我们经常会想完成一些注册&调用的功能，比如我们有四个函数：

现在我们想将这四个函数和 +、-、*、/ 四个操作符绑定，那么我们该怎么做？

可能我们第一反应是这样：

operator_map = {}	
def add(a: int, b: int) -> float:	
    return a + b	
def sub(a: int, b: int) -> float:	
    return a - b	
def mul(a: int, b: int) -> float:	
    return a * b	
def div(a: int, b: int) -> float:	
    return a / b	
operator_map["+"] = add	
operator_map["-"] = sub	
operator_map["*"] = mul	
operator_map["/"] = div

但这样写起来，有一个很大的问题就是太不美观了。因为直接对于 dict 的操作从实际上来讲可维护性是很差的，那么我们这个地方应该怎么做？

在改进这段代码之前，我们首先要明确 Python 中一个很重要的概念，即：函数/方法是：First Class Member 。用不精确的话来讲，就是函数/方法可以作为参数被传递、被使用。

举个例子：

import typing	
def execute(func: typing.Callable, *args, **kwargs) -> typing.Any:	
    return func(*args, **kwargs)	
def print_func(data: int) -> None:	
    print(data)	
execute(print, 2)

大家可以看到我们将 print_func 这个函数作为参数传递给 execute 函数并被调用。

那么我们来改造下之前的代码：

好了，大家看看，目前整体代码的可读性以及可维护性是不是改了很多？

但是我们现在的问题在于，每次都需要在单独调用一次 register_operator 函数，这样也太烦了吧！要不要再改进一下？要得。我们可以用装饰器来改进一下。

首先，看一个最简单的装饰器例子：

import functools	
import typing	
import time	
def execute(func: typing.Callable) -> typing.Callable:	
    @functools.wraps(func)	
    def wraps(*args, **kwargs) -> typing.Any:	
        start_time = time.time()	
        result = func(*args, **kwargs)	
        print("{}".format(time.time() - start_time))	
        return result	
    return wraps	
@execute	
def add(a: int, b: int) -> float:	
    return a + b

我们能看到这段函数的意义是计算函数的执行时间。那么这个原理是什么？

实际上装饰器是一个语法糖，具体可以参见 PEP318 Decorators for Functions and Methods。

简而言之，实际上是 Python 替我们做了一个替换过程。以上面的例子为例，这个替换过程就是 add=execute(add) 。

好了，我们就用这个知识点来改进下之前的代码：

import typing	
operator_map = {}	
def register_operator(operator: str) -> typing.Callable:	
    def wraps(func: typing.Callable) -> typing.Callable:	
        operator_map[operator] = func	
        return func	
    return wraps	
@register_operator("+")	
def add(a: int, b: int) -> float:	
    return a + b	
@register_operator("-")	
def sub(a: int, b: int) -> float:	
    return a - b	
@register_operator("*")	
def mul(a: int, b: int) -> float:	
    return a * b	
@register_operator("/")	
def div(a: int, b: int) -> float:	
    return a / b

这样我们这段代码的注册过程是不是就显得更优雅了？

嗯，是的！实际上 Python 中有很多特性会帮助我们的代码更简洁，更优美。

接下来这个例子很可能帮我们减轻工作量。

聊聊 OrderedDict

dict 是我们经常使用的一种数据解构。但是在 Python 3.6 之前 dict 都是无序的，即我插入的顺序，和数据在 dict 中存放的顺序并无关联（笔者注：Python 3.6 dict 有序只是新版实现的顺带产物，Python 3.7 正式作为 feature 被固定下来）。

但是很多时候，比如在验签等场景，我们需要保证 dict 数据存放顺序，和我们插入顺序是一致的。那么我们该怎么办？

老板有需求下来了，我们肯定不能告诉老板这个需求没法做。那我们就自己实现一个ordereddict 吧。于是，想了想，写了如下的代码：

import typing	
class OrderedDict:	
    def __init__(self, *args, **kwargs):	
        self._data = {}	
        self._ordered_key = []	
    def __getitem__(self, key: typing.Any) -> typing.Any:	
        return self._data[key]	
    def __setitem__(self, key: typing.Any, value: typing.Any) -> None:	
        if key not in self._data:	
            return	
        self._data[key] = value	
        self._ordered_key.append(key)	
    def __delitem__(self, key: typing.Any):	
        del self._data[key]	
        self._ordered_key.remove(key)

通过额外维护一个 list 来维护 key 插入的顺序。这段代码，看似完成了我们的需求，但是实则存在很大问题。大家可以猜猜问题在哪？

3，2，1！

揭晓答案，这段代码利用 list 来保证 key 的有序性，在删除的时候， list 的删除操作，是一个时间复杂度 O(n) 的操作。换句话说，我们的删除操作随着内部数据的增多，所需的删除时间也变得越长。这对于某些性能敏感的场景是无法接受的。

那要怎么办呢？事实上，Python 在很早之前就已经内置了有序字典，即很多人可能都用过的 collections.OrderedDict 。

在 OrderedDict 中， Python 维护了一个双向链表解构，来保证插入的有序性，如下图所示：

640?wx_fmt=png

在最左侧维护一个卫兵节点，卫兵节点的 next 指针恒指向于数据中最后插入的节点。那么插入新的数据时，我们将新的数据插入到卫兵节点之后，从而达成维护插入顺序的目的。

在删除的时候，通过额外维护的一个字典找到待删除的 key 所对应的节点。这个操作是 O(1) 的复杂度，然后大家都知道，双向链表删除一个节点的时间复杂度也是 O(1) 。通过这样保证我们在即便有大量数据的情况下，也能保证相应的性能。

好了，我们按照这个思路来做一个最简单的实现：

import typing	
class Node:	
    def __init__(self, key: typing.Any, value: typing.Any) -> None:	
        self.key = key	
        self.value = value	
        self.prev = None	
        self.next = None	
class OrderedDict:	
    def __init__(self, *args, **kwargs):	
        self._data = {}	
        self._head = Node(None, None)	
        self._last = self._head	
    def __getitem__(self, key: typing.Any) -> typing.Any:	
        if key in self._data:	
            return self._data[key].value	
        raise ValueError	
    def __setitem__(self, key: typing.Any, value: typing.Any) -> None:	
        if key not in self._data:	
            return	
        value_node = Node(key, value)	
        next_node = self._head.next	
        if not next_node:	
            self._head.next = value_node	
            value_node.prev = self._head	
            self._last = value_node	
        else:	
            value_node.next = next_node	
            next_node.prev = value_node	
            value_node.prev = self._head	
            self._head.next = value_node	
        self._data[key] = value_node	
    def __delitem__(self, key: typing.Any):	
        if key not in self._data:	
            return	
        value_node = self._data[key]	
        if value_node == self._last:	
            self._last = value_node.prev	
            self._last.next = None	
        else:	
            prev_node = value_node.prev	
            next_node = value_node.next	
            prev_node.next = next_node	
            next_node.prev = prev_node	
        del self._data[key]	
        del value_node

（此段代码，如有错乱，烦请将浏览字体调小几号）

这只是一个 OrderedDict 的简化版，如果想完成一个完整的 OrderedDict 还有很多很多的 corner case 要去处理。不过现在，我们可以使用内置的数据结构去完成我们需求。怎么样，是不是有了一种幸福的感觉？

随意聊聊

通过今天的两个例子，我们发现 Python 提供了相当多的功能去帮助我们完成日常的工作与学习任务。同时通过去深入地了解 Python 内部的一些功能实现，以便我们能更好地去学习一些知识。比如，上文提到的 OrderedDict 的实现，会让我们学到双头链表的一种非常典型的应用，与此同时，双头链表也会用于诸如 LRU 这样非常常用的数据解构的实现。所以，多去深入了解 Python 的方方面面，有助于我们整体能力的提升。

那么既然电脑上已经有了 Python，为何不将这些 tricks 用起来，让 Python 更 6 呢？安利这位来自德国的大咖，资深养蛇玩家 Dan Bader。

他的博客 dbader.org 每月有超过 20 万的浏览量，Real Python 视频累计浏览量超过百万。订阅他的邮件，每天都会准时收到他更新 Python 技巧，一日不差，是一个极其自律的人。

畅销书 Python Tricks 作者，影响全球 1 000 000 以上程序员的 PythonistaCafe 社区创始人，Real Python 培训机构总编，拥有近 20 年软件开发经验。巴德尔毕业于欧洲历史悠久的慕尼黑工业大学，该校以优异的科教质量闻名，截至 2018 年已经培养出 17 位诺贝尔奖得主。

他把自己对 Python 的理解成书，试图通过一些常用的小例子帮助更多开发者拥抱 Python。