kyle6666-优快云博客

原创 Haddop+spark大数据分析（二）之Hadoop 集群的搭建

文章目录前言一、pandas是什么？二、使用步骤 1.引入库 2.读入数据总结前言上一节介绍了虚拟机的下载以及Java环境的搭建，这节主要讲解Hadoop集群的搭建一、集群环境的下载及其配置我们需要现在一台机器上配置好 hadoop，然后再把它拷贝到其他机器上，这里我选择在master 也就是要做为 nameNode 的那台机器1.下载hadoop再次强调建议在克隆之前，先在一台机器上，下载、解压好再克隆，这样多台机器就都有了下载...

2021-05-28 11:16:45 589

原创 Hadoop+Spark 大数据分析（一）之虚拟机安装及Java环境的配置

系统与平台文章目录目录系统与平台文章目录前言一、系统环境二、系统设计1.主机分配2.功能分配三、环境准备1.安装虚拟机2.配置Java环境说明环境监察安装JDK配置JDK3.配置网络参数设置主机名配置 hosts 文件配置静态IP禁用防火墙四、集群环境搭建1.下载 hadoop总结前言为了学习大数据下的数据分析，第一次尝试搭建完全分布式的...

2021-05-28 09:25:31 804

翻译 pandas中groupby()方法 as_index属性的使用

print各种可能性import pandas as pddf = pd.DataFrame(data = {'book':['bk1','bk1','bk2','bk2','bk3'],'price':['12','12','5','5','45']})print(df)print(df.groupby('book',as_index = True).sum())print(df.groupby('book',as_index = False).sum())output: books

2021-05-20 16:37:28 3408

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 Haddop+spark大数据分析（二）之Hadoop 集群的搭建

原创 Hadoop+Spark 大数据分析（一）之 虚拟机安装及Java环境的配置

翻译 pandas中groupby()方法 as_index属性的使用

空空如也

空空如也

原创 Hadoop+Spark 大数据分析（一）之虚拟机安装及Java环境的配置