- 博客(6)
- 收藏
- 关注
原创 02_说出你的最爱(print)
学习内容 python第三方库网站 https://www.lfd.uci.edu/~gohlke/pythonlibs/
2019-05-20 22:37:08
147
原创 01_利用IDEA建立你的第一个python
时间不多,上车 环境搭建 集成开发工具------IDEA(基于内存的,速度快) 具体配如下图,不解释 重启,完成!!!! 创建第一个python工程 尽情的书写你的人生吧,提前恭喜你!!! ...
2019-05-04 22:59:42
733
原创 工具篇----Ubuntu虚拟机配置静态ip和ssh远程登陆
Ubuntu虚拟机配置静态ip 系统:、 Ubuntu18.10 配置静态ip的设置需要修改的文件 第一步:vi /etc/network/interfaces内容 interfaces(5) file used by ifup(8) and ifdown(8) auto lo iface lo inet loopback auto ens33 ifac...
2019-05-04 17:39:03
755
原创 大数据之日志分析步骤
日志分析处理步骤 数据采集 Flume:将web日志写入HDFS中 数据清洗: Spark、Hive、MapReduce或者其他分布式框架,去除不符合要求的数据,清洗完之后的数据可以存放在HDFS中 数据处理:按照需求,进行相应的业务统计和分析,使用Spark、Hive、MapReduce或者其他分布式框架,去除不符合要求的数据 处理结果的存放 结果可以存放在RDBMS或者Nosq...
2019-04-29 23:17:58
3092
原创 hadoop001
Hadoop **HDFS要点 文件的线性分割------Block; 偏移量(文件以二进制存储,计算机最小单位byte,hdfs解决了中文被拆分问题) Block需要均匀的分散存储在集群节点之中,副本的数量不要超过集群节点的数量(相同的数据在同一节点存储多份没有意义)。 单个Block的大小是一致的(hadoop2.x以上一个Block的大小是128MB),文件和文件的大小可以不一致 Bloc...
2019-04-29 21:53:56
321
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅