- 博客(94)
- 收藏
- 关注
原创 Python+大数据-Spark技术栈(二)SparkBase&Core
Python+大数据-Spark技术栈(二)SparkBase&Core
2022-11-08 22:38:10
1002
原创 Python+大数据-Spark技术栈(一) SparkBase环境基础
Python+大数据-Spark技术栈(一) SparkBase环境基础
2022-11-08 21:27:00
1149
原创 Python+大数据-hadoop(八)-Apache Hive函数高阶应用、性能调优
Python+大数据-hadoop(八)-Apache Hive函数高阶应用、性能调优
2022-10-29 22:09:52
217
原创 Python+大数据-hadoop(七)-Apache Hive SQL DQL、参数配置与函数
Python+大数据-hadoop(七)-Apache Hive SQL DQL、参数配置与函数
2022-10-29 22:06:46
940
原创 Python+大数据-hadoop(五)--数据仓库、Apache 01
Hive是Facebook开源出来,后来贡献给力Apache .宗旨是:提高分析数据的能力降低分析数据的开发成本。如果不一致,hive会尝试进行转换,但是不保证成功,如果不成功显示null。猜想1:只要在hive中创建表,那么在HDFS就会有一个文件夹与之对应。数仓本身不生产数据也不消费数据,按照数据流入流出的特点,对平台进行分层。最基础最核心的3层架构,企业实际应用中,可以结合需要添加不同分层。注意:在某些场合下,说ORACLE也是OLAP系统,如何理解?在此过程中,Hive做了什么?
2022-10-29 22:01:19
1143
1
原创 Python+大数据-hadoop(四)-Hadoop MapReduce、YARN、HA
yarn是一个通用资源管理系统和调度平台。详细解释见课堂画图资源指的跟程序运行相关的硬件资源 比如:CPU RAM。
2022-10-29 21:56:38
1117
原创 Python +大数据-hadoop生态-hadoop(三)--Hadoop HDFS
Python +大数据-hadoop生态-hadoop(三)--Hadoop HDFS
2022-10-29 21:48:57
397
原创 Python+大数据-Hadoop生态-hadoop(二)--Apache Hadoop
Python+大数据-Hadoop生态-hadoop(二)--Apache Hadoop
2022-10-29 18:07:59
358
原创 Python+大数据-Hadoop生态-hadoop(一)--大数据导论、Apache Zookeeper
Python+大数据-Hadoop生态-hadoop(一)--大数据导论、Apache Zookeeper
2022-10-29 18:04:19
440
原创 Python +大数据-Hadoop生态-Linux(二)-集群搭建和安装
Python +大数据-Hadoop生态-Linux(二)-集群搭建和安装
2022-10-29 18:01:32
256
原创 Python + 大数据-Hadoop生态-Linux(一)-环境搭建和Vi
Python + 大数据-Hadoop生态-Linux(一)-环境搭建和Vi
2022-10-29 17:58:19
816
原创 解决 seaborn 报错 URLError:<urlopen error [WinError 10060]
解决 seaborn 报错 URLError:<urlopen error [WinError 10060]
2022-10-19 17:36:09
406
原创 Jupyter Notebook 可以启动打开 但是打开不了ipynb的文件,报500 错误的解决办法
Jupyter Notebook 可以启动打开 但是打开不了ipynb的文件,报500 错误的解决办法
2022-10-09 16:06:11
2485
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人