探索大数据发现技术:解锁数据价值的新途径
1. 发现技术概述
在大数据解决方案领域,传统的大数据系统主要聚焦于预测分析、机器学习等技术。而发现技术(Discovery)则独具特色,它能够整合来自不同结构化和非结构化数据源的数据,为用户创建一个统一的环境,使用户可以轻松找到所需数据,并探索数据趋势以进行进一步分析。
发现技术具备两大关键能力:
- 整合多元数据源 :将不同来源的数据整合为一个连贯的整体。
- 灵活搜索数据 :使用类似搜索引擎但更灵活的输入方式进行数据搜索,输出能为数据赋予更丰富的含义。
例如,将会计系统中的应收账款信息与仓库系统中的发货信息相结合,就可以挖掘出原本难以察觉的模式,如不同地区客户的购买行为模式,这对于进行有意义的客户细分具有重要意义。
2. 知名发现系统
- Endeca :Oracle旗下产品,得名于德语“entdecken”(意为“发现”)。1999年在马萨诸塞州剑桥市成立,2011年被Oracle收购。其Endeca InFront(现称Oracle Endeca Commerce)为沃尔玛、波音、福特等众多公司的网站提供支持。
- Lucene和Solr :由Apache开发,与Hadoop同属Apache软件基金会。Solr最初由Yonik Seeley为CNET网站开发,2006年源代码捐赠给Apache基金会。此后,Instagram、Digg、reddit等众多平台都采用了该系统。
超级会员免费看
订阅专栏 解锁全文
1112

被折叠的 条评论
为什么被折叠?



