大数据分析:现状、技术与应用
1. 大数据分析概述
大数据分析在当今各行业中发挥着至关重要的作用。在考虑大数据应用时,我们需要明确哪些数据提取是有价值的,以及这些输出如何应用于日常运营。然而,实施大数据分析的成本是采用大数据技术的一个商业障碍。同时,匿名性、隐私和数据保护是大数据技术跨行业的重要要求。
当前,行业正在应用大规模机器学习和其他算法来分析海量数据集,并结合复杂事件处理和流处理进行实时分析。以下是大数据分析涉及的一些主要技术领域:
- 大规模:推理、基准测试和机器学习
- 流数据处理
- 链接数据和语义方法在大数据分析中的应用
2. 大规模:推理、基准测试和机器学习
2.1 大规模推理
在语义网背景下所倡导的推理,由于可扩展性问题,目前无法满足大数据的需求。推理基于一些原则,如合理性和完整性,但这些与实际的网络数据特征相差甚远,网络数据往往是矛盾、不完整且规模巨大的。
为克服网络规模推理的问题,目前的先进方法提出将推理和信息检索方法(基于搜索技术)相结合。例如,通过从不完全和近似推理的角度来处理数据。同时,基于大型文本集合中单词共现模式自动构建的语义模型(分布语义模型)可以支持对结构化数据的查询和推理。
在存储系统方面,索引技术和检索策略对于可扩展性至关重要。例如,在线(反向)推理和离线(正向)推理之间的权衡是需要考虑的因素。LarKC 项目是处理大规模可扩展推理系统和技术的旗舰项目,它利用语义技术来解决相关问题。
2.2 大规模存储库的基准测试
大规模语义数据处理领域的基准测试尚处于起步阶段。Linked D
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



