自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Haddop+spark大数据分析(二)之Hadoop 集群的搭建

文章目录前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言上一节介绍了虚拟机的下载以及Java环境的搭建,这节主要讲解Hadoop集群的搭建一、集群环境的下载及其配置我们需要现在一台机器上配置好 hadoop,然后再把它拷贝到其他机器上,这里我选择在master 也就是要做为 nameNode 的那台机器1.下载hadoop再次强调 建议在克隆之前,先在一台机器上,下载、解压好再克隆,这样多台机器就都有了下载...

2021-05-28 11:16:45 554

原创 Hadoop+Spark 大数据分析(一)之 虚拟机安装及Java环境的配置

系统与平台文章目录目录系统与平台文章目录前言一、系统环境二、系统设计1.主机分配2.功能分配三、 环境准备1.安装虚拟机​2.配置Java环境说明环境监察安装JDK​配置JDK​​​3.配置网络参数设置主机名配置 hosts 文件配置静态IP禁用防火墙四、集群环境搭建1.下载 hadoop总结前言为了学习大数据下的数据分析,第一次尝试搭建完全分布式的...

2021-05-28 09:25:31 763

翻译 pandas中groupby()方法 as_index属性的使用

print各种可能性import pandas as pddf = pd.DataFrame(data = {'book':['bk1','bk1','bk2','bk2','bk3'],'price':['12','12','5','5','45']})print(df)print(df.groupby('book',as_index = True).sum())print(df.groupby('book',as_index = False).sum())output: books

2021-05-20 16:37:28 3360

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除