Python精进系列：ord 函数

进一步有进一步的欢喜

于 2025-03-01 17:18:44 发布

阅读量1.7k

点赞数 22

分类专栏： Python 精进系列文章标签： python 开发语言

本文链接：https://blog.youkuaiyun.com/qq_22866291/article/details/145950539

版权

Python 精进系列专栏收录该内容

50 篇文章

订阅专栏

一、引言

在 Python 编程里，字符和编码的处理是常见的操作。ord 函数作为 Python 内置函数之一，在字符和 Unicode 编码之间搭建了一座桥梁。它能帮助开发者轻松地将字符转换为对应的 Unicode 码点，在字符处理、加密、排序等多个场景中发挥着重要作用。

二、基本概念

2.1 Unicode 编码简介

在了解 ord 函数之前，我们需要先了解一下 Unicode 编码。Unicode 是一种字符编码标准，它为世界上几乎所有的字符都分配了一个唯一的数字编号，这个编号被称为码点。通过 Unicode 编码，我们可以在不同的系统和编程语言中统一处理各种语言和符号。

2.2 ord 函数定义

ord 函数的作用是返回一个字符串字符对应的 Unicode 码点（整数表示）。其基本语法如下：

ord(c)

其中，参数 c 是一个长度为 1 的字符串，也就是单个字符。如果传入的字符串长度不为 1，会抛出 TypeError 异常。函数返回的是该字符对应的 Unicode 码点，是一个整数。

三、使用示例

3.1 处理 ASCII 字符

ASCII 是一种早期的字符编码标准，它包含了英文字母、数字和一些常见符号。在 Python 中，使用 ord 函数可以轻松获取 ASCII 字符的码点。

# 获取大写字母 'A' 的 Unicode 码点
print(ord('A'))  # 输出: 65

# 获取小写字母 'a' 的 Unicode 码点
print(ord('a'))  # 输出: 97

# 获取数字 '0' 的 Unicode 码点
print(ord('0'))  # 输出: 48

从这些示例可以看出，ord 函数能够准确地返回 ASCII 字符对应的码点，这些码点是固定的，可以帮助我们在编程中进行字符的比较和处理。

3.2 处理非 ASCII 字符

除了 ASCII 字符，ord 函数还可以处理各种非 ASCII 字符，包括不同语言的文字和表情符号等。

# 获取中文字符 '中' 的 Unicode 码点
print(ord('中'))  # 输出: 20013

# 获取表情符号 '😃' 的 Unicode 码点
print(ord('😃'))  # 输出: 128515

这表明 ord 函数在处理不同类型的字符时具有很好的通用性，无论字符来自哪种语言或符号体系，都能准确地返回其对应的 Unicode 码点。

四、与 chr 函数的关系

chr 函数是 ord 函数的逆操作。chr 函数接受一个整数（Unicode 码点）作为参数，返回对应的字符。下面的示例展示了它们之间的关系：

# 使用 ord 函数获取字符 'B' 的码点
code_point = ord('B')
print(f"字符 'B' 的 Unicode 码点是: {code_point}")  # 输出: 字符 'B' 的 Unicode 码点是: 66

# 使用 chr 函数将码点转换回字符
character = chr(code_point)
print(f"码点 {code_point} 对应的字符是: {character}")  # 输出: 码点 66 对应的字符是: B

通过 ord 和 chr 函数的配合使用，我们可以在字符和其对应的 Unicode 码点之间进行灵活的转换，这在很多编程场景中都非常有用。

五、实际应用场景

5.1 字符排序

在对字符进行排序时，我们可以利用 ord 函数将字符转换为对应的码点，然后根据码点的大小进行排序。例如，对一个字符串列表按照字符的 Unicode 码点顺序进行排序：

characters = ['b', 'A', 'c', 'a']
sorted_characters = sorted(characters, key=lambda x: ord(x))
print(sorted_characters)  # 输出: ['A', 'a', 'b', 'c']

这里使用 sorted 函数和 lambda 表达式，将每个字符转换为其对应的 Unicode 码点，然后根据码点进行排序。

5.2 简单加密算法

在一些简单的加密场景中，我们可以通过对字符的 Unicode 码点进行操作来实现加密和解密。例如，将每个字符的码点加上一个固定的偏移量：

def encrypt(text, offset):
    encrypted_text = ""
    for char in text:
        encrypted_text += chr(ord(char) + offset)
    return encrypted_text

def decrypt(text, offset):
    decrypted_text = ""
    for char in text:
        decrypted_text += chr(ord(char) - offset)
    return decrypted_text

original_text = "hello"
offset = 3
encrypted = encrypt(original_text, offset)
decrypted = decrypt(encrypted, offset)

print(f"原始文本: {original_text}")  # 输出: 原始文本: hello
print(f"加密后的文本: {encrypted}")  # 输出加密后的文本
print(f"解密后的文本: {decrypted}")  # 输出: 解密后的文本: hello

在这个示例中，encrypt 函数将原始文本中的每个字符的码点加上偏移量，然后使用 chr 函数将新的码点转换为字符，得到加密后的文本。decrypt 函数则进行相反的操作，将加密后的文本解密回原始文本。

5.3 字符验证

在某些情况下，我们需要验证输入的字符是否在某个范围内。通过 ord 函数获取字符的码点，然后进行比较，就可以实现字符验证。例如，验证输入的字符是否为大写字母：

def is_uppercase(char):
    code_point = ord(char)
    return 65 <= code_point <= 90

test_char = 'M'
print(is_uppercase(test_char))  # 输出: True

这里通过比较字符的 Unicode 码点是否在大写字母的码点范围内，来判断该字符是否为大写字母。

六、注意事项

6.1 输入参数要求

ord 函数的参数必须是长度为 1 的字符串。如果传入的字符串长度不为 1，会抛出 TypeError 异常。例如：

try:
    print(ord('ab'))
except TypeError as e:
    print(f"错误: {e}")  # 输出: 错误: ord() expected a character, but string of length 2 found

因此，在使用 ord 函数时，要确保传入的是单个字符。

6.2 跨平台兼容性

由于 Unicode 是一种通用的字符编码标准，ord 函数在不同的平台和 Python 版本中都能保持一致的行为。但在处理一些特殊字符或历史编码时，还是需要注意可能存在的差异。

七、总结

ord 函数作为 Python 中一个重要的内置函数，为我们处理字符和 Unicode 编码提供了极大的便利。通过它，我们可以轻松地将字符转换为对应的 Unicode 码点，并且可以与 chr 函数配合使用，实现字符和码点之间的灵活转换。在字符排序、加密、验证等多个实际应用场景中，ord 函数都发挥着重要作用。同时，在使用 ord 函数时，要注意输入参数的要求和可能存在的跨平台兼容性问题。