20、分布式查询处理中的安全权限管理

异步汪仔

于 2025-11-10 16:52:45 发布

阅读量13

点赞数

CC 4.0 BY-SA版权

分类专栏：数据外包中的隐私守护文章标签：安全模型关系配置文件基于图的模型

本文链接：https://blog.youkuaiyun.com/d3e4f/article/details/154764283

数据外包中的隐私守护专栏收录该内容

23 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

分布式查询处理中的安全权限管理

在数据管理和查询处理中，安全模型和权限管理是至关重要的。本文将深入探讨安全模型、关系配置文件、基于图的模型以及授权视图等相关概念，帮助你更好地理解如何在分布式查询处理中确保数据的安全性和合规性。

1. 安全模型

安全模型在数据管理中起着关键作用，它通过权限来限制可以向每个主体发布的数据。权限可以基于实例进行限制，例如，允许Alice查看至少开了一种治疗方案的医生的姓名，但不包括从未开过治疗方案的医生的姓名。此外，实例级限制还可以支持仅在请求明确输入时才发布某些信息的情况。

2. 关系配置文件

为了确定是否应授权发布某个关系，我们需要捕获该关系的信息内容。为此，引入了关系配置文件的概念。

定义：给定一个关系R，其关系配置文件是一个三元组[Rπ, R◃▹, Rσ]，其中：
Rπ是R中的属性集（即R的模式）。
R◃▹是用于定义/构造R的基本关系的集合，可能为空。
Rσ是在定义/构造R时选择条件中涉及的属性集合，可能为空。

根据这个定义，基本关系R(a1, …, an)的关系配置文件是[{a1, …, an}, R, ∅]。

操作结果的配置文件 ：根据关系运算符的语义，不同操作的结果配置文件如下：
| 操作 | Rπ | R◃▹ | Rσ |
| — | — | — | — |
| R := πA(Rl) | A | R◃▹l | Rσl |
| R := σA(Rl) | Rπl | R◃▹l | Rσl ∪ A |
| R := Rl◃▹jRr | Rπl ∪ Rπr | R◃▹l ∪ R◃▹r | Rσl ∪ Rσr |

以下是mermaid格式的流程图，展示了关系操作与配置文件的关系：

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(关系操作):::process -->|投影| B(R := πA(Rl)):::process
    A -->|选择| C(R := σA(Rl)):::process
    A -->|连接| D(R := Rl◃▹jRr):::process
    B -->|结果配置文件| E([A, R◃▹l, Rσl]):::process
    C -->|结果配置文件| F([Rπl, R◃▹l, Rσl ∪ A]):::process
    D -->|结果配置文件| G([Rπl ∪ Rπr, R◃▹l ∪ R◃▹r, Rσl ∪ Rσr]):::process

3. 基于图的模型

我们使用混合图（包含无向和有向弧的图）来建模数据库模式、权限和查询。

模式图 ：给定一组关系R、一组引用完整性约束I和一组连接条件J，模式图G(N, E)定义如下：
N = {Ri.*: Ri ∈ R}
E = J ∪ I ∪ {(Ri.K, Ri.a): Ri ∈ R ∧ a ≠ K}
蕴含视图 ：权限和关系配置文件对应于关系集R上的视图，分别由[A, R]表示。给定一个权限p = [Att, Rels]，其蕴含视图V = [A, R]定义为A = Att，R = Rels；给定一个关系配置文件[Rπ, R◃▹, Rσ]，其蕴含视图V = [A, R]定义为A = Rπ ∪ Rσ，R = R◃▹。
视图图 ：视图图是通过对原始模式图进行着色得到的，用三种颜色表示不同的信息：黑色表示视图携带的信息；白色表示属于R∗中关系但不在A中的非黑色属性及其与主键的连接弧；清晰表示其他属性或弧。视图图的定义如下：

# 视图图着色函数
def COLORGRAPH(G, [A, R]):
    NV = N
    EV = E
    for n in NV:
        λV(n) = 'clear'
    for (ni, nj) in EV:
        λV(ni, nj) = 'clear'
    for R in R∗:
        for a in R.*:  # 着色节点
            if a in A:
                λV(R.a) = 'black'
            else:
                λV(R.a) = 'white'
        for (ni, nj) in joinpath(R∗):  # 着色连接路径
            λV(ni, nj) = 'black'
        for (ni, nj) in {(ni, nj): ∃R ∈ R∗, ni = R.K ∧ nj ⊆ R.*}:
            if λV(nj) == 'black' or nj appears in joinpath(R∗):
                λV(ni, nj) = 'black'
            else:
                λV(ni, nj) = 'white'
    GV = (NV, EV, λV)
    return GV

通过视图图，我们可以直观地表示权限和关系配置文件所蕴含的视图。

4. 授权视图

为了评估主体请求的查询是否可以执行，我们遵循以下原则：如果主体有权限查看某个关系所携带的信息内容，则该关系（无论是基本关系还是查询结果）可以发布给该主体。

授权权限 ：一个权限授权发布一个关系，当且仅当关系配置文件所蕴含的信息（直接或间接）是该权限授权查看信息的子集。同时，要确保没有间接信息泄露。间接信息泄露的主要来源有两个：
查询中对未返回属性的条件限制（即WHERE子句中出现但SELECT子句中未出现的属性）。
查询中限制返回元组的连接条件。

为了正式定义权限是否授权发布关系，我们首先确定适用于关系配置文件的权限：
- 适用权限 ：权限[Att, Rels]适用于关系配置文件[Rπ, R◃▹, Rσ]，当且仅当Rels∗ ⊆ R◃▹∗。
- 授权权限 ：给定一个适用于关系配置文件R = [Rπ, R◃▹, Rσ]的权限p = [Att, Rels]，p授权发布R当且仅当GR≼NGp。

例如，对于图5.7中的权限和图5.8中查询Q2计算的关系，适用的权限包括p1和p4，但它们都不授权发布查询结果。而对于查询“SELECT P.SSN, DoB FROM Patient AS P WHERE Race = ‘asian’”，权限p1是唯一适用且授权该查询的权限。

权限组合 ：检查单个权限是否授权关系配置文件是不够的，因为可能存在没有单个权限能授权发布关系，但关系配置文件所发布的信息是被授权的情况。因此，我们需要进行权限组合。

权限组合必须谨慎进行，以确保组合不会授权原始权限都未授权的额外查询。为了确定两个权限是否可以组合，我们利用关系数据库连接理论的一个基本结果：两个关系产生无损连接当且仅当至少其中一个关系在其属性交集上存在函数依赖。

在我们的场景中，给定两个权限pi = [Atti, Relsi]和pj = [Attj, Relsj]，它们的可组合性取决于它们可见属性的交集（即Atti ∩ Attj），并且需要考虑引用完整性约束来评估其中一个权限的可见属性对公共属性的函数依赖。这可以通过分析对应于两个权限的视图图Gpi和Gpj来实现。

依赖关系 ：我们定义了依赖关系pi→pj，表示pj依赖于pi，当且仅当对于所有满足λpj(nj) = black的节点nj，存在对应于{Atti ∩ Attj}的节点n，使得在Gpj中存在从n到nj的仅由有向黑色弧组成的路径。
安全组合 ：如果pi→pj或pj→pi或两者都成立，则两个权限可以安全组合。组合后的权限定义为pi⊗pj = [Atti ∪ Attj, Relsi ∪ Relsj]。

以下是mermaid格式的流程图，展示了权限组合的过程：

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(权限pi):::process -->|组合| B(权限pj):::process
    B --> C{是否可组合?}:::process
    C -->|是| D(组合后的权限pi⊗pj):::process
    C -->|否| E(不组合):::process

通过权限组合，我们可以更灵活地管理权限，确保在满足安全要求的前提下，能够满足用户的查询需求。

分布式查询处理中的安全权限管理

5. 权限组合的具体示例与分析

为了更清晰地理解权限组合的概念，我们结合之前提到的权限示例进行详细分析。

权限	描述
p1	[(SSN, DoB, Race), (Patient)] → Alice
p2	[(SSN, Type, Cost, Duration), (Treatment)] → Alice
p3	[(Race, Specialty), (Treatment, Patient, Doctor)] → Alice
p4	[(SSN, Job, Salary), (Employee)] → Alice
p5	[(Name), (Treatment, Doctor)] → Alice

以权限p1和p4为例，它们的交集是属性SSN，而SSN是p1中Patient关系和p4中Employee关系的键。根据依赖关系的定义，p1↔p4，即它们可以安全组合。组合后的权限p1⊗p4 = [(SSN, DoB, Race, Job, Salary), (Patient, Employee)]。

再看权限p1和p3，它们的交集是属性Race，但p1和p3都不依赖于Race，即p1̸↔p3，所以它们不能安全组合。

以下是mermaid格式的流程图，展示了权限组合判断的详细过程：

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(权限pi和pj):::process --> B(计算交集Atti ∩ Attj):::process
    B --> C(分析视图图Gpi和Gpj):::process
    C --> D{是否存在依赖关系?}:::process
    D -->|是| E(可以安全组合):::process
    D -->|否| F(不可以组合):::process

6. 权限组合的代码实现

在实际应用中，我们可以通过代码来实现权限的组合功能。以下是一个简单的Python代码示例：

class Permission:
    def __init__(self, att, rels):
        self.att = set(att)
        self.rels = set(rels)

    def __str__(self):
        return f"[{', '.join(self.att)}, ({', '.join(self.rels)})]"

    def is_applicable(self, relation_profile):
        # 检查是否适用
        rels_star = self.rels  # 简化处理，实际中需考虑R∗
        r_joins_star = relation_profile.r_joins  # 简化处理
        return rels_star.issubset(r_joins_star)

    def can_combine(self, other):
        # 检查是否可以组合
        common_att = self.att.intersection(other.att)
        # 这里简化依赖关系的判断，实际需分析视图图
        if len(common_att) > 0:
            return True
        return False

    def combine(self, other):
        # 组合权限
        new_att = self.att.union(other.att)
        new_rels = self.rels.union(other.rels)
        return Permission(new_att, new_rels)


# 创建权限实例
p1 = Permission(['SSN', 'DoB', 'Race'], ['Patient'])
p4 = Permission(['SSN', 'Job', 'Salary'], ['Employee'])

if p1.can_combine(p4):
    combined_permission = p1.combine(p4)
    print(f"组合后的权限: {combined_permission}")
else:
    print("权限不能组合")

7. 授权视图在分布式查询处理中的应用

在分布式查询处理中，授权视图的概念起着至关重要的作用。当用户发起查询请求时，系统需要根据用户的权限和查询的关系配置文件来判断是否授权执行该查询。

以下是一个简单的操作步骤：
1. 解析查询 ：将用户的查询语句解析为关系配置文件，包括选择的属性、连接的关系和选择条件。
2. 确定适用权限 ：根据关系配置文件，找出适用于该查询的权限。
3. 检查授权 ：检查单个权限或权限组合是否授权发布查询结果。

例如，用户Alice发起了一个查询：

SELECT P.SSN, DoB
FROM Employee AS E
JOIN Patient AS P
ON E.SSN = P.SSN
WHERE Race = 'asian'

系统首先将该查询解析为关系配置文件[(SSN, DoB), (Employee, Patient), (Race)]。然后，找出适用于该关系配置文件的权限，如p1和p4。接着，检查这些权限是否授权发布查询结果，发现p1和p4都不授权，此时需要考虑权限组合。如果组合后的权限满足授权条件，则可以执行查询并返回结果。