互联网数据源集成与工作流管理系统设计
1. MIX数据集成模型
MIX(Metadata - based Integration of Internet Sources)是一种用于集成互联网数据源的方法。它可以避免在所有属性上达成一致,让不同数据源就关键方面达成相同理解,即便它们有不同的语义假设和上下文。
1.1 数据集成步骤
MIX的数据集成过程分为两个步骤:
- 步骤一:转换到公共上下文
语义对象需使用合适的转换函数转换到一个公共上下文,这个公共上下文可由对数据感兴趣的应用指定。例如,定义一个公共表示上下文S:
S = { < LocationCode, “ThreeLetterCode” >,
< DateFormat, “DD.MM.YYYY” >,
< TypeCode, “FullClassName” >,
< Currency, “EUR” >,
< Scale, 1 >
}
- 步骤二:识别并融合相同对象
通过比较标识属性,识别代表同一真实世界对象的语义对象,并将它们融合成一个公共表示。例如,使用上述上下文S作为公共上下文和转换函数,可将某些语义对象分类为代表同一报价,然后通过合并属性集将它们集成到一个语义对象中。以下是一个统一的MIX表示示例:
SemObjAB = < CarOffer, {
< Company, “Budget” >,
< L
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



