- 博客(14)
- 收藏
- 关注
原创 Hadoop
Hadoop是一个适合处理海量数据的分布式存储和分布式计算的平台。Hadoop 解决了两方面问题:一个是数据的存储 另一个是数据的计算为什么需要使用Hadoop解决海量数据的存储和计算? 当有1T的数据量,拿过来需要对其进行做存储和计算 单个计算机 做数据存储 和 数据计算,那么压力非常大,如何解决单个节点的资源不足问题? 分而治之: 可以将1T数据量,分成10份,由 10个节点(计算机)做数据的存储和计算,每个计算机处理的数据量大概为100G。
2023-10-08 10:32:34
167
1
原创 Linux中yum的安装
参考https://developer.aliyun.com/mirror/centos?由于我们是非ECS用户,所以源配置文件中包含aliyuncs.com地址访问不了。从阿里官方网站下载对应系统版本的源配置文件。安装:yum install 包名。卸载:需要借助rpm进行卸载。备份原有的源配置文件。
2023-07-30 19:55:53
269
1
原创 tar命令(压缩打包)和Vim操作
vi/vim编辑器,就是命令行模式下的文本编辑器,用来编辑文件vim是vi的升级版,一般用vim即可,包含全部vi功能基础命令vi 文件路径vim 文件路径运行模式命令模式,默认的模式,可以通过键盘快捷键控制文件内容输入模式,通过命令模式键盘输入"i"进入,可以输入内容进行编辑,按esc退回命令模式底线命令模式,通过命令模式键盘输入":"进入,可以对文件进行保存、关闭等操作。
2023-07-27 21:10:02
410
1
原创 linux基础命令
vi/vim编辑器,就是命令行模式下的文本编辑器,用来编辑文件vim是vi的升级版,一般用vim即可,包含全部vi功能基础命令vi 文件路径vim 文件路径运行模式命令模式,默认的模式,可以通过键盘快捷键控制文件内容输入模式,通过命令模式键盘输入"i"进入,可以输入内容进行编辑,按esc退回命令模式底线命令模式,通过命令模式键盘输入":"进入,可以对文件进行保存、关闭等操作。
2023-07-26 21:42:23
843
1
原创 傻瓜式修改Linux配置
2.将内存部分设置为至少2GB,如果电脑配置较好,就4GB 3.处理器数量设为2,内核数量设为2 4.USB控制器里面将勾选取消 5.将打印机移除以上设置完之后,就可以打开虚拟机了(用root身份登录)
2023-07-25 22:21:50
262
原创 DataFrame
DataFrame是一个类似于表格的数据类型,可以理解为一个二维数组,索引有两个维度,可更改。DataFrame具有以下特点:列可以是不同的类型大小可变标记轴(行和列)针对行与列进行轴向统计DataFrame。
2023-07-25 10:46:41
344
原创 Python进阶
Class是一种抽象概念,而实例(Instance)则是一个个具体的Student比如定义的Class_Student,是指学生这个概念Jack是具体的Student面向对象的设计思想是抽象出Class,根据Class创建Instance面向对象主要有三大特点:封装、继承和多态封装:将一段代码放入一个函数中,使用这段代码时就调用这段函数继承:一个派生类(子类)继承基类(父类)的所有属性和方法。继承也允许把一个派生类的对象作为一个基类对象对待多态:父类的引用指向子类的对象。
2023-07-24 20:25:49
242
原创 Pandas
pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型结构化数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。Python长期以来一直非常适合数据整理和准备,你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之 一。
2023-07-24 20:22:20
51
原创 一文入门Python
Python 中只有模块(module),类(class)以及函数(def、lambda)才会引入新的作用域,其它的代码块(如 if/elif/else/、try/except、for/while等)是不会引入新的作用域的,也就是说这些语句内定义的变量,外部也可以访问。各个命名空间是独立的,没有任何关系的,所以一个命名空间中不能有重名,但不同的命名空间是可以重名而没有任何影响。set和dict类似,也是一组key的集合,但不存储value,由于key不能重复,所以,在set中,没有重复的key。
2023-07-15 11:17:00
111
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人