自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 SparkShuffle

SparkShuffle的发展史及各个策略的详解

2023-11-16 20:50:24 155 1

原创 Hadoop

Hadoop是一个适合处理海量数据的分布式存储和分布式计算的平台。Hadoop 解决了两方面问题:一个是数据的存储 另一个是数据的计算为什么需要使用Hadoop解决海量数据的存储和计算?​ 当有1T的数据量,拿过来需要对其进行做存储和计算​ 单个计算机 做数据存储 和 数据计算,那么压力非常大,如何解决单个节点的资源不足问题?​ 分而治之:​ 可以将1T数据量,分成10份,由 10个节点(计算机)做数据的存储和计算,每个计算机处理的数据量大概为100G。

2023-10-08 10:32:34 167 1

原创 MySQL安装

关闭防火墙修改主机名配置静态IP配置hosts IP 主机名映射关系。

2023-07-31 12:53:26 83 1

原创 crontab方法的解析与使用

有什么没明白的地方,或者想进行实操,可以到。

2023-07-30 20:05:30 123 1

原创 Linux中JDK的安装

上传到虚拟机(需要jdk包的私信我)进行初始化工作(省略)修改配置文件(省略)

2023-07-30 19:59:00 64 1

原创 Linux中yum的安装

参考https://developer.aliyun.com/mirror/centos?由于我们是非ECS用户,所以源配置文件中包含aliyuncs.com地址访问不了。从阿里官方网站下载对应系统版本的源配置文件。安装:yum install 包名。卸载:需要借助rpm进行卸载。备份原有的源配置文件。

2023-07-30 19:55:53 269 1

原创 tar命令(压缩打包)和Vim操作

vi/vim编辑器,就是命令行模式下的文本编辑器,用来编辑文件vim是vi的升级版,一般用vim即可,包含全部vi功能基础命令vi 文件路径vim 文件路径运行模式命令模式,默认的模式,可以通过键盘快捷键控制文件内容输入模式,通过命令模式键盘输入"i"进入,可以输入内容进行编辑,按esc退回命令模式底线命令模式,通过命令模式键盘输入":"进入,可以对文件进行保存、关闭等操作。

2023-07-27 21:10:02 410 1

原创 linux基础命令

vi/vim编辑器,就是命令行模式下的文本编辑器,用来编辑文件vim是vi的升级版,一般用vim即可,包含全部vi功能基础命令vi 文件路径vim 文件路径运行模式命令模式,默认的模式,可以通过键盘快捷键控制文件内容输入模式,通过命令模式键盘输入"i"进入,可以输入内容进行编辑,按esc退回命令模式底线命令模式,通过命令模式键盘输入":"进入,可以对文件进行保存、关闭等操作。

2023-07-26 21:42:23 843 1

原创 傻瓜式修改Linux配置

​ 2.将内存部分设置为至少2GB,如果电脑配置较好,就4GB​ 3.处理器数量设为2,内核数量设为2​ 4.USB控制器里面将勾选取消​ 5.将打印机移除以上设置完之后,就可以打开虚拟机了(用root身份登录)

2023-07-25 22:21:50 262

原创 DataFrame

DataFrame是一个类似于表格的数据类型,可以理解为一个二维数组,索引有两个维度,可更改。DataFrame具有以下特点:列可以是不同的类型大小可变标记轴(行和列)针对行与列进行轴向统计DataFrame。

2023-07-25 10:46:41 344

原创 Python 内存管理和垃圾回收

基于C源码。

2023-07-24 20:53:55 90

原创 Python进阶

Class是一种抽象概念,而实例(Instance)则是一个个具体的Student比如定义的Class_Student,是指学生这个概念Jack是具体的Student面向对象的设计思想是抽象出Class,根据Class创建Instance面向对象主要有三大特点:封装、继承和多态封装:将一段代码放入一个函数中,使用这段代码时就调用这段函数继承:一个派生类(子类)继承基类(父类)的所有属性和方法。继承也允许把一个派生类的对象作为一个基类对象对待多态:父类的引用指向子类的对象。

2023-07-24 20:25:49 242

原创 Pandas

pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型结构化数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。Python长期以来一直非常适合数据整理和准备,你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之 一。

2023-07-24 20:22:20 51

原创 一文入门Python

Python 中只有模块(module),类(class)以及函数(def、lambda)才会引入新的作用域,其它的代码块(如 if/elif/else/、try/except、for/while等)是不会引入新的作用域的,也就是说这些语句内定义的变量,外部也可以访问。各个命名空间是独立的,没有任何关系的,所以一个命名空间中不能有重名,但不同的命名空间是可以重名而没有任何影响。set和dict类似,也是一组key的集合,但不存储value,由于key不能重复,所以,在set中,没有重复的key。

2023-07-15 11:17:00 111 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除