多维数据建模与交互式处理
多维数据空间基础
宏观数据定义了多维数据空间,其维度由类别属性描述,单元格中包含由汇总属性描述的事实数据。以下是几个关键定义:
1. 度量(Measures) :度量 $m = (T, F)$ 由可能的度量值集合 $T$(如自然数或实数,常补充一些空值)和一组计算函数 $F$ 定义,$F$ 中的每个元素是一个对,包含源度量集合 ${m_1, …, m_n}$ 和一个函数 $f : IN_{m_1.T} ×…×m_n.T → m.T$。例如,发病率是一种度量,类型为“实数”,通过“病例数”和“人年数”相除并乘以 $\frac{1}{100,000}$ 计算得出。
2. 汇总属性(Summary attributes) :汇总属性 $sa = (m, O, f_{sum}, f_{aggr})$ 基于度量 $m$ 定义,其中 $O$ 是描述的对象集合,$f_{sum} : 2^O → m.T$ 是部分汇总函数,定义了 $O$ 子集的 $sa$ 值计算方式,$f_{aggr}$ 是一族部分聚合函数。若 $f_{aggr}$ 是全函数,则 $sa$ 关于特征 $f$ 和对象集 $O$ 是可汇总的;若该函数对所有两两不相交的类别集都有定义,则 $sa$ 是不相交可汇总的。
3. 类别属性(Category attributes) :类别属性 $ca = (O, f, C)$ 由对象集合 $O$、特征 $f$ 和描述 $f$ 的类别集合 $C ⊂ D_f$ 定义。
基于以上定义,数据空间 $ds = (O, CA, sa)$ 由底层对象集 $O
超级会员免费看
订阅专栏 解锁全文
997

被折叠的 条评论
为什么被折叠?



