Hadoop:是一个能够对大量数据进行分布式处理的软件框架,是一个能让用户轻松架构和使用的分布式计算平台。
Spark:是一个基于内存计算的开源集群计算系统,目的是更快速地进行数据分析。
Storm:是一种开源软件,一个分布式、容错的实时计算系统。
Apache Drill:Drill项目帮助Google实现海量数据集的分析处理,包括分析抓取Web文档、跟踪安装在Android Market 上的应用程序数据、分析垃圾邮件、分析Google分布式构建系统上的测试结果等。
Datafocus:是一款大数据分析工具,是全球首个中文自然语言数据分析系统,将数据分析变得像百度搜索一样简单,直接输入自然语言,就可以把数据分析结果智能以最合适的图表展示。