53、互联网数据源集成与工作流管理系统设计

互联网数据源集成与工作流管理系统设计

1. MIX数据集成模型

MIX(Metadata - based Integration of Internet Sources)是一种用于集成互联网数据源的方法。它可以避免在所有属性上达成一致,让不同数据源就关键方面达成相同理解,即便它们有不同的语义假设和上下文。

1.1 数据集成步骤

MIX的数据集成过程分为两个步骤:
- 步骤一:转换到公共上下文
语义对象需使用合适的转换函数转换到一个公共上下文,这个公共上下文可由对数据感兴趣的应用指定。例如,定义一个公共表示上下文S:

S = { < LocationCode, “ThreeLetterCode” >,
< DateFormat, “DD.MM.YYYY” >,
< TypeCode, “FullClassName” >,
< Currency, “EUR” >,
< Scale, 1 >
}
  • 步骤二:识别并融合相同对象
    通过比较标识属性,识别代表同一真实世界对象的语义对象,并将它们融合成一个公共表示。例如,使用上述上下文S作为公共上下文和转换函数,可将某些语义对象分类为代表同一报价,然后通过合并属性集将它们集成到一个语义对象中。以下是一个统一的MIX表示示例:
SemObjAB = < CarOffer, {
< Company, “Budget” >,
< L
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值