适合Java开发的大数据工具和框架:对大数据的存储和处理需要非SQL存储/处理数据工具,例如,NoSQL数据库,全文搜索引擎,实时流式处理,图形数据库等
- Datomic
–完全事务,云就绪,分布式数据库,用Clojure编写。
是一个灵活的、基于时间因子的数据库,支持联合查询,具有弹性的可扩展性以及支持ACID事务性。Datomic 提供高可用的、分布式存储服务。
- Amazon DynamoDB
–快速,灵活的全面管理NoSQL的数据库服务,适用于任何规模的要求一致性,单位毫秒延迟的应用程序。一种完全托管的 NoSQL 数据库服务,提供快速而可预测的性能,能够实现无缝扩展。
Oracle Coherence–内存数据网格解决方案,通过提供对常用数据的快速访问,使企业能够可预测地扩展关键任务应用程序。简单来说,Coherence仅支持Java,.NET和C++ API三个版本。
- CouchDB
–开源的面向文档的NoSQL数据库,使用JSON存储数据。
- CouchBase
–开源分布式的NoSQL面向文档数据库,针对交互式应用程序进行了优化。延后写入和松散存储。基于Apache CouchDB,并整合了GeoCouch。
- Apache Hadoop
–用Java编写的开源软件框架,用于分布式存储,并对非常大的数据集进行分布式处理。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群进行高速运算和存储。
HDFS对海量数据进行存储,Mapreduce对海量数据进