
大数据与云计算
文章平均质量分 63
阿达斯加
再微小的光,也可以照亮黑暗
展开
-
Hive+数据挖掘算法学习笔记
1.hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive的优点是学习成本低,可以通过类似SQL语句实现快速MapReduce统计,使MapReduce变得更加简单,而不必开发专门的MapReduce应用程序。hive十分适合对数据仓库进行统计分析。2.hive 查询操作过程严格原创 2022-04-11 20:01:05 · 2375 阅读 · 0 评论 -
NoSQL学习笔记
NoSQL的Cache是记录级的,是一种细粒度的Cache,所以NoSQL在这个层面上来说性能就要高很多。NoSQL有时也称作Not Only SQL的缩写,是对不同于传统的关系型数据库的数据库管理系统的统称。接口层提供了五种选择:Rest,Thrift,Map/Reduce,Get/Put,特定语言API,使得应用程序和数据库的交互更加方便。内存和硬盘相结合的形式,结合了前两种形式的优点,既保证了速度,又保证了数据不丢失。四是图模型,这种模型的使用场景不多,通常是基于图数据结构的数据定制的。原创 2024-09-13 15:45:55 · 969 阅读 · 0 评论