深入理解glom项目中的模式(Modes)机制-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00572/article/details/148915939

深入理解glom项目中的模式(Modes)机制

glom ☄️ Python's nested data operator (and CLI), for all your declarative restructuring needs. Got data? Glom it! ☄️ 项目地址: https://gitcode.com/gh_mirrors/gl/glom

什么是glom模式？

在Python数据处理库glom中，"模式"(Modes)是一个核心概念，它决定了如何解释和处理Python内置数据结构。简单来说，模式就像是glom处理数据时使用的"方言"，它定义了字典(dict)、元组(tuple)、列表(list)等数据结构在glom规范(spec)中的解释方式。

为什么需要模式？

模式的存在让glom规范保持简洁和可读性。通过不同的模式，我们可以：

改变数据结构的解释方式
实现不同的数据处理逻辑
保持核心功能的一致性

glom的三种主要模式

1. Auto模式(默认)

Auto模式是glom的默认行为，主要用于数据转换。在这种模式下，规范(spec)就像一个模板，指导glom如何将输入数据转换为期望的输出格式。

2. Fill模式

Fill模式是Auto模式的变体，它更倾向于"填充"容器而不是迭代或链接。当你想确保数据结构保持原样，只是填充其中的值时，Fill模式特别有用。

3. Match模式

Match模式将规范视为模式匹配的模板，用于检查目标数据是否与给定的规范匹配。这在数据验证场景中非常实用。

模式的工作原理

模式的核心机制是通过设置glom作用域(scope)中的MODE键来实现的。当指定一个模式时，glom会在作用域中注册一个处理函数，这个函数决定了如何处理后续的数据结构。

自定义模式开发

虽然大多数情况下使用内置模式就足够了，但glom也支持自定义模式开发。要创建自定义模式，需要：

创建一个类，实现glomit方法
在glomit方法中设置scope[MODE]为你自定义的处理函数
处理函数需要接受target、spec和scope三个参数

自定义模式示例

以下是一个简化版的Fill模式实现，展示了自定义模式的基本结构：

class Fill(object):
    def __init__(self, spec):
        self.spec = spec

    def glomit(self, target, scope):
        scope[MODE] = _fill  # 设置自定义处理函数
        return scope[glom](target, self.spec, scope)

def _fill(target, spec, scope):
    # 定义递归处理函数
    recurse = lambda val: scope[glom](target, val, scope)
    
    # 处理字典类型
    if type(spec) is dict:
        return {recurse(key): recurse(val)
                for key, val in spec.items()}
    
    # 处理序列类型
    if type(spec) in (list, tuple, set, frozenset):
        result = [recurse(val) for val in spec]
        if type(spec) is list:
            return result
        return type(spec)(result)
    
    # 处理可调用对象
    if callable(spec):
         return spec(target)
    
    # 默认返回规范本身
    return spec