- 博客(3)
- 收藏
- 关注
原创 Haddop+spark大数据分析(二)之Hadoop 集群的搭建
文章目录前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言上一节介绍了虚拟机的下载以及Java环境的搭建,这节主要讲解Hadoop集群的搭建一、集群环境的下载及其配置我们需要现在一台机器上配置好 hadoop,然后再把它拷贝到其他机器上,这里我选择在master 也就是要做为 nameNode 的那台机器1.下载hadoop再次强调 建议在克隆之前,先在一台机器上,下载、解压好再克隆,这样多台机器就都有了下载...
2021-05-28 11:16:45
554
原创 Hadoop+Spark 大数据分析(一)之 虚拟机安装及Java环境的配置
系统与平台文章目录目录系统与平台文章目录前言一、系统环境二、系统设计1.主机分配2.功能分配三、 环境准备1.安装虚拟机2.配置Java环境说明环境监察安装JDK配置JDK3.配置网络参数设置主机名配置 hosts 文件配置静态IP禁用防火墙四、集群环境搭建1.下载 hadoop总结前言为了学习大数据下的数据分析,第一次尝试搭建完全分布式的...
2021-05-28 09:25:31
763
翻译 pandas中groupby()方法 as_index属性的使用
print各种可能性import pandas as pddf = pd.DataFrame(data = {'book':['bk1','bk1','bk2','bk2','bk3'],'price':['12','12','5','5','45']})print(df)print(df.groupby('book',as_index = True).sum())print(df.groupby('book',as_index = False).sum())output: books
2021-05-20 16:37:28
3360
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人