- 博客(10)
- 收藏
- 关注
原创 Hadoop入门
狭义上:大数据是一类技术栈,是一种用来处理海量数据的软件技术体系。广义上:大数据是数字化时代、信息化时代的基础(技术)支撑,以数据为生活赋能。分布式数据存储分布式数据计算分布式资源调度为一体的整体解决方案。Apache Hadoop是典型的分布式软件框架,可以部署在1台乃至成千上万台服务器节点上协同工作。个人或企业可以借助Hadoop构建大规模服务器集群,完成海量数据的存储和计算。Hadoop是Apache旗下的一个用Java语言实现开源软件框架,是一个存储和计算大规模数据的软件平台。
2025-01-07 20:13:19
1080
原创 MapReduce 简介
MapReduce是一个分布式、并行处理的计算框架。MapReduce 把任务分为 Map 阶段和 Reduce 阶段。开发人员使用存储在HDFS 中数据(可实现快速存储),编写 Hadoop 的 MapReduce 任务。由于 MapReduce工作原理的特性, Hadoop 能以并行的方式访问数据,从而实现快速访问数据。
2024-11-22 10:36:38
2040
原创 Yarn简介
Yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。服务器会运行多个程序, 每个程序对资源(CPU内存等)的使用都不同
2024-11-22 09:43:28
867
原创 Linux基础
学习Linux, 本质上是学习在命令行下熟练使用Linux的各类命令。命令行: 即Linux终端(Terminal),是一种命令提示符页面。 以纯“字符”的形式操作系统, 可以使用各种字符化命令对系统发出操作指令。命令: 即Linux程序。一个命令就是一个Linux的程序。命令没有图形化页面,可以在命令行(终端中)提供字符化的反馈。无论是什么命令,用于什么用途,在Linux中,命令有其通用的格式:command [options] [parameter]
2024-10-31 21:57:09
973
原创 PL/SQL概述
PL/SQL(Procedure Language/SQL)是 Oracle对 sql 语言的过程化扩展,指在 SQL 命令语言中增加了过程处理语句(如分支、循环等),使 SQL 语言具有过程处理能力。把SQL语言的数据操纵能力与过程语言的数据处理能力结合起来,使得 PLSQL 面向过程但比过程语言简单、高效、灵活和实用。
2024-10-21 21:13:29
3294
原创 MySQL的优化
在应用的开发过程中,由于初期数据量小,开发人员写SQL语句更加重视功能上的实现,但是当应用系统正式上线后,随着数据量的急剧增长,很多SQL语句开始逐渐显露出性能问题,对生产的影响也越来越大,此时这些有问题的SQL语句就成为整个系统性能的瓶颈,因此我们必须要对它们进行优化.
2024-10-20 10:04:16
2025
原创 MySQL的事务
事务的特性(ACID):原子性(Atomicity):事务是一个不可分割的整体,事务开始后的所有操作要么全部完成,要么全部不做.一致性(Consistency):系统从一个正确的状态,迁移到另一个正确的状态.隔离性(Isolation):每个事务的对象对其他事务的操作对象互相分离,事务提交前对其他事务不可见.持久性(Durability):事务一旦提交.则其结果是永久性的.
2024-10-20 09:02:46
483
原创 MySQL的索引概述
索引是通过某种算法,构建出一个数学模型,用于快速找出在某个列中有一特定的行,不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大,查询数据所花费的时间就越多,如果表中查询的列有一个索引,MySQL能够快速到达一个位置去搜索数据文件,而不必查看所有数据,那么将会节省很大一部分时间。索引类似一本书的目录,比如要查找’student’这个单词,可以先找到s开头的页然后向后查找,这个就类似索引。
2024-10-14 15:20:13
704
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人