
大数据
Bamshk
这个作者很懒,什么都没留下…
展开
-
sqoop 将数据导入hive注意事项
sqoop 将数据导入hive注意事项1.在sqoop的配置文件 sqoop-env.sh配置如下export HADOOP_COMMON_HOME=/soft/hadoopexport HADOOP_MAPRED_HOME=/soft/hadoopexport HIVE_HOME=/soft/hive2.将hive安装目录下的的lib目录下的jar包导入到sqoop安装目录lib下...原创 2020-04-16 18:17:20 · 341 阅读 · 0 评论 -
大数据复习复习(hadoo+hive+mongodb+hbase)
1.传统的关系型数据库的B树,更新少量数据效率高,mapReduce更新大量数据效率高2.关系型数据库与MapReduce比较MapReduce比较适合以批处理方式处理需要分析整个数据集的问题,尤其是动态分析。RDBMS适合于点查询和更新,数据集被索引之后,数据库系统能提供低延迟的数据检索和快速的少量数据更新。MapReduce适合一次写入,多次读取的数据的应用,关系型数据库更适合持续更新...原创 2019-05-10 08:43:36 · 706 阅读 · 0 评论 -
迷你版的centos安装net-tools,使用ifconfig
安装完迷你版本的centos 并不支持使用ifconfig,需要安装net-toolsyum install net-tools -y原创 2019-07-14 17:46:52 · 180 阅读 · 0 评论 -
网站流量日志分析系统笔记(Hadoop大数据技术原理与应用)
一、系统架构设计首先,会将Nginx服务器所产生的日志文件通过Flume采集到HDFS中;其次,开发人员根据原始日志文件及规定数据格式定制开发MapReduce程序进行数据与处理;接着,通过Hive进行最为重要的数据分析;再次,将分析的记过通过sqoop工具导出到关系数据库MySQL中;最后,通过Web系统,实现最为重要的数据分析二、系统概述虚拟机中的Flume采集网站日志...原创 2019-07-16 01:51:35 · 2463 阅读 · 2 评论