自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 大数据开发面试题-yarn

大数据开发面试题-yarn框架

2025-05-29 07:00:00 330

原创 大数据面试题-mapreduce

大数据面试题mapreduce

2025-05-28 07:00:00 659

原创 大数据开发面试题-HDFS

大数据面试-hdfs系列

2025-05-27 07:00:00 1716

原创 SQL每日一练(10)

sql每日一练10 非常好的一道题!

2025-05-27 07:00:00 369

原创 SQL每日一练(9)

结果输出:员工 ID、人员姓名、statistics 得分、SQL 得分、python 得分、data_visualization 得分、mathematics 得分、总分、考核时间、最终考核结果(取值 pass/fail )。其中 statistics、SQL、python、data_visualization 4 个科目为必考项,每个科目得分需 >= 60 分;共有多少人通过考核?若通过一次考核则视为人员考核通过,若考核通过则输出考核通过中总分最高的记录;若考核未通过则输出考核未通过中总分最高的记录;

2025-05-26 07:15:00 557

原创 SQL每日一练(8)

直的注意的是题目中给我们的是sale-date,我们需要转换成年月去计算,TO_CHAR。因此涉及到多步操作,我们用窗口函数或者多步子查询即可。2020 年 9 月的销售额(四舍五入到整数),同比(2 位小数百分比),环比(2 位小数百分比)为多少?题目一思路:同比环比问题,老问题了,利用lag函数 1和12去算同环比即可.查询 2020 年,每月的销售额,以及同比、环比,并按照年月进行升序排序。填写示例:10000 130.12% 130.12%结果输出:年份,月份,销售额,同比,环比。

2025-05-26 07:00:00 286

原创 SQL每日一练(7)

Class1 班级 data_visualization 平均分与 Class2 中 data_visualization 平均分的差值(四舍五入保留 2 位小数)?查询 Class1 班级 data_visualization 平均分与 Class2 中 data_visualization 平均分的差值。结果输出:Class1_data_visualization 平均分,Class2_data_visualization 平均分,差值。继续做一下题目,这次是连续两道题目连在一起的,就一起做了。

2025-05-25 11:05:40 356

原创 SQL 每日一题(6)

第一题思路:累积离职利用sum窗口函数求和即可,当年离职利用order by排序即可。第一次累计超过 100 人离职的是哪一年?对应的当年离职人数为多少?第二题思路,将第一题转换为t1表,在t1表基础上进行查询即可。原始表:employee_resignations表。结果输出:年度、当年离职人数、累计离职人数。查询累计到每个年度的离职人数。填写示例:2008 120。

2025-05-25 10:26:59 405

原创 SQL每日一题(5)

题目一:思路:排名当然dense_rank排序了,然后其余直接查询就好。或者利用order by desc limit offset即可。查询新进类型中,不同原因的合计人数以及人数排名。排名第 4 的原因是什么?题目二:搜索对应rank =4的即可。结果输出原因、人数、排名。填写示例:社会招聘 20。

2025-05-24 23:05:33 2465 1

原创 SQL每日一题(4)

年龄段划分及排序(默认左闭右开):25 岁以下,25 - 30 岁,30 - 35 岁,35 - 40 岁,40 - 45 岁,45 - 50 岁,50 - 55 岁,55 岁及以上,异常情况。题目二:思路将题目1转换为t1表,在对t1表进行row_number()窗口函数进行排序结合order by即可搜索,其他直接查询。查询在岗员工各个年龄段的人数,结果输出年龄段及对应的人数,按年龄段升序排序。人数第 2 多的年龄段是哪个?查询异常人数 直接从employees表进行查询即可。结果输出:年龄段,人数。

2025-05-24 22:39:17 535

原创 SQL每日一练(3)

难得看到了套好题,没考我,呜呜,今日第三更!原始表(ai生成)

2025-05-24 15:21:32 332 1

原创 SQL每日一练(2)

题目1:思路:根据题目查询,然后做连接,主要考察case when then end的用法。题目2:思路很简单order by排序limit1 需要注意四舍五入需要用round函数。1、查询所有时间内,各个国家的销售情况,销售金额大于1000视为业绩合格,否则不合格。2、所有时间年内,总销售金额最大的国家?销售金额(四舍五入到整数)。结果输出:国家、销售金额、业务情况。例子 中国 10000。

2025-05-24 14:49:47 363

原创 SQL每日一练

昨天没更,准备下项目今天打算面字节。跟大家分享下,很抽象,上来就是自我介绍加说手撕sql,感觉不难但是很抽象,没a出来。然后换了到sql,一样没做出来,最后换了个算法,做出来了,然后啥没问,基本挂了。看来sql能力还是有待提高,所以新开一个系列,sql每日一练,也可能每日多练分好几天发,嘿嘿。对了,下周四考试,中间少投简历了,打算先复习考试。对了面了沐数科技做了笔试,以为是习题,结果是找规律和性格测试,昨天看了看这家公司之前的sql题贮备了下,感觉还不错(至少正常且合理),就拿这个题来一套。

2025-05-24 14:13:49 990

原创 数据结构-堆

简单介绍基于完全二叉树的一种数据结构-堆,并简单介绍其的应用

2025-05-22 19:59:45 1150

原创 数据结构-图

本文简单介绍了数据结构-图

2025-05-21 22:03:04 942

原创 数据结构-二叉树及其拓展

简单介绍数据结构二叉树及其拓展

2025-05-20 11:51:44 2206

原创 数据结构-栈与队列

在数据结构的学习中,栈和队列 是两种基础且重要的线性结构。它们的特点鲜明,应用场景广泛,是理解复杂数据结构(如树、图)和算法(如 DFS、BFS)的基础。本文将从概念、实现、应用场景等方面深入解析这两种结构,并对比它们的异同点。

2025-05-19 21:00:48 935

原创 数据结构-链表的介绍

简单介绍数据结构-链表

2025-05-18 14:21:27 590

原创 数据结构-数组的介绍

简单介绍数据结构其一的数组。

2025-05-17 21:01:41 1104

原创 大数据基础之SQL锁MVCC介绍

本文深入探讨了SQL中的多版本并发控制(MVCC)机制,旨在解决并发场景下的读写冲突问题。MVCC通过版本链和读视图两个核心组件实现,版本链管理数据的历史版本,而读视图决定当前事务可见的版本。文章详细介绍了版本链的构成和生成规则,以及读视图的可见性判断规则。此外,文章还阐述了MVCC如何在不同事务隔离级别(如读已提交、可重复读、读未提交和串行化)下实现事务隔离,通过控制读视图的生成时机来确保事务能看到一致的数据版本。MVCC机制有效提高了数据库的并发性能,同时保证了事务的隔离性。

2025-05-16 07:00:00 419

原创 大数据基础之SQl的锁的基本介绍

本文深入探讨了SQL锁机制,旨在解决多用户并发访问数据库时可能出现的脏读、不可重复读、幻读和丢失更改等问题。文章首先介绍了锁的基本概念和分类,包括锁的粒度(行锁、表锁、间隙锁等)和模式(共享锁、排他锁、意向锁等)。接着,对比了InnoDB和MyISAM两种存储引擎在锁实现上的差异,指出InnoDB适合高并发写操作,而MyISAM适合低并发读操作。最后,文章讨论了悲观锁和乐观锁的不同应用场景,悲观锁适用于强一致性需求,而乐观锁则适用于低冲突场景。通过这一系列分析,文章为数据库并发控制提供了全面的解决方案。

2025-05-15 18:57:30 536

原创 大数据-Hadoop生态文件存储格式

介绍hadoop生态圈常见的文件格式

2025-05-15 07:00:00 709

原创 大数据开发-数据导入流程有关Flume采集kafka数据到sparkstreaming进行流计算

介绍如何将流式数据从kafka导入到spark

2025-05-14 07:15:00 770

原创 大数据开发-数据导入流程如何利用sqoop导入数据

在前两篇文章上,我们详细介绍了在大数据实际场景下如何用datax去进行导入数据的场景,我么不难发现主要分为了3步,即创建hive的目标表,配置datax的jdbc文件,在通过datax.py去进行导入。相比于datax,sqoop省略了创建了目标表的步骤,更为简略。那么就来介绍一下实际应用的过程。一、环境准备1.1 安装 Sqoop# 下载 Sqoop 1.4.7ln -s /opt/sqoop-1.4.7.bin__hadoop-2.6.0 /opt/sqoop # 创建软链接# 配置环境变量。

2025-05-14 07:00:00 393

原创 大数据开发-数据导入流程有关DataX服务器端关于动态传参的示例

详细介绍了大数据应用场景中datax的动态传参和自动更新机制,包含代码以及一些重要地方,在注释中标注。

2025-05-13 16:43:52 741

原创 大数据开发-数据导入流程有关DataX服务器端关于一般数据导入的示例

关于数据导入的datax篇,后续会继续更新。

2025-05-13 15:25:17 601

原创 linux笔试常考总结

linux笔试和日常生活工作中常用命令,后续会更新。

2025-05-12 21:13:31 2505 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除