自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(132)
  • 收藏
  • 关注

原创 数据分析常用模型:RFM模型、漏斗模型、AARRR模型

数据分析常用模型:RFM模型、漏斗模型、AARRR模型

2024-10-30 18:08:49 3229

原创 Pandas数据结构之Series对象

Pandas数据结构之Series对象

2024-10-29 16:58:41 734

原创 Pandas数据结构之Series对象

pandas的数据结构:Series

2024-10-27 19:33:57 1063

原创 力扣之612.平面上的最近距离

力扣之612.平面上的最近距离

2024-10-25 09:00:45 343

原创 力扣之613.直线上的最近距离

力扣之613.直线上的最近距离

2024-10-24 21:03:42 314

原创 MySQL基础知识一:MySQL数据类型、索引、事务、存储引擎

MySQL基础知识一:MySQL数据类型、索引、事务、存储引擎

2024-10-24 11:22:24 1070

原创 Hive优化:Hive的执行计划、分桶、MapJoin、数据倾斜

Hive优化:Hive的执行计划、分桶、MapJoin、数据倾斜

2024-10-18 21:11:03 1325

原创 常用Python数据分析开源库:Numpy、Pandas、Matplotlib、Seaborn、Sklearn介绍

常用Python数据分析开源库:Numpy、Pandas、Matplotlib、Seaborn、Sklearn介绍

2024-10-17 16:49:10 1411

原创 spark:Structured Streaming介绍

spark:Structured Streaming介绍

2024-10-16 20:33:28 1247

原创 Hadoop生态圈三大组件:HDFS的读写流程、MapReduce计算流程、Yarn资源调度

Hadoop生态圈三大组件:HDFS的读写流程、MapReduce计算流程、Yarn资源调度

2024-10-15 17:18:12 1697

原创 Spark SQL 的离线数仓开发

Spark SQL的离线数仓开发

2024-10-15 15:52:16 310

原创 Spark数据源的读取与写入、自定义函数

Spark数据源的读取与写入、自定义函数

2024-10-15 15:14:28 632

原创 Spark内置函数:字符串、日期和时间函数、聚合函数、数值函数、条件判断函数、窗口函数

Spark内置函数:字符串、日期和时间函数、聚合函数、数值函数、条件判断函数、窗口函数

2024-10-15 11:38:13 1294

原创 spark:数据的关联与合并、缓存和checkpoint

spark:数据的关联与合并、缓存和checkpoint

2024-10-14 20:22:05 523

原创 Spark:DataFrame介绍及使用

DataFrame介绍及使用

2024-10-13 21:07:53 1384

原创 SparkSQL介绍及使用

SparkSQL介绍及使用

2024-10-13 20:28:02 566

原创 RDD优化:缓存和checkpoint机制、数据共享(广播变量、累加器)、RDD的依赖关系、shuffle过程、并行度说明

RDD优化:缓存和checkpoint机制、数据共享(广播变量、累加器)、RDD的依赖关系、shuffle过程、并行度说明

2024-10-11 21:15:53 1608

原创 Spark常用RDD算子:transformation转换算子以及action触发算子

transformation 转换算子对RDD数据进行转化得到新的RDD,定义了一个线程任务。常见:map、filter、flatMap、reduceByKey、groupByKey、sortByKeyaction 执行算子触发计算任务,让计算任务进行执行,得到结果。触发线程执行的。常见:foreach、first、count、reduce、saveAsTextFile、collect、take。

2024-10-10 19:45:00 1783 2

原创 力扣之607.销售员

607.销售员

2024-10-10 09:44:43 822

原创 Hadoop服务端口号、Spark端口号、Hive端口号以及启动命令

Hadoop服务端口号、Spark端口号、Hive端口号以及启动命令

2024-10-09 15:12:25 892

原创 RDD的介绍、RDD的特点、创建RDD数据

RDD的介绍、RDD的特点、创建RDD数据

2024-10-09 11:09:54 1447

原创 一篇文章带你了解数据处理方式(单机数据处理、集群数据处理)、分布式计算框架、Spark的分布式计算、多任务以及进程和线程的区别

数据处理方式(单机数据处理、集群数据处理)、分布式计算框架、Spark的分布式计算、多任务以及进程和线程的区别

2024-10-09 08:47:17 1051

原创 力扣之603.连续空余座位

603.连续空余座位

2024-10-08 19:54:30 573

原创 Python面向对象基础

Python面向对象

2024-10-07 21:17:34 2425

原创 力扣之586.订单最多的客户

586.订单最多的客户

2024-09-28 10:09:27 353

原创 力扣之597.好友申请I:总体通过率

597.好友申请I:总体通过率

2024-09-28 10:08:46 975

原创 力扣之585.2016年的投资

585.2016年的投资

2024-09-27 15:11:06 856

原创 python模块:os模块、导入模块的方式、制作模块以及常见的模块

python模块:os模块、导入模块的方式、制作模块以及常见的模块

2024-09-27 14:58:13 3047

原创 Python:异常处理

Python:异常处理

2024-09-26 20:46:42 3004

原创 力扣之578.查询回答率最高的问题

578.查询回答率最高的问题

2024-09-26 09:35:45 715 1

原创 力扣之580.统计各专业学生人数

580.统计各专业学生人数

2024-09-26 08:38:45 606

原创 力扣之574.当选者

574.当选者

2024-09-25 21:14:11 471

原创 Python文件操作

了解什么是文件,以及文件读写数据的方式

2024-09-25 20:58:31 1683

原创 力扣之534.游戏玩法分析III

534.游戏玩法分析III

2024-09-23 08:38:36 974

原创 力扣之512.游戏玩法分析II

512.游戏玩法分析II

2024-09-23 08:37:18 347

原创 力扣之511.游戏玩法分析I

511.游戏玩法分析I

2024-09-22 14:26:35 361

原创 力扣之184.部门工资最高的员工

184.部门工资最高的员工

2024-09-22 11:03:57 412

原创 力扣之183.从不订购的客户

183.从不订购的客户

2024-09-22 10:30:25 475

原创 力扣之182.查找重复的电子邮箱

182.查找重复的电子邮箱

2024-09-21 14:26:28 446

原创 力扣之178.分数排名

178.分数排名

2024-09-21 08:29:46 416

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除