自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(164)
  • 收藏
  • 关注

原创 招聘网站—Hive数据分析

第1关:统计最热门的十种职业(招聘人数最多)第2关:分析学历相同的情况下每种职位的平均薪资第3关:统计各个职业要求具备的技能及其出现的次数第4关:分析每种职业在各个薪资等级需要招聘的人数任务描述在之前的任务中,我们完成了对招聘的清洗,接下来我们需要通过获取到的招聘数据来统计查询我们想要的数据信息。本关任务:统计最热门的十种职业(招聘人数最多)。在 hive 中创建数据库 mydb;在 mydb 中创建 recruitcleaned 表用来存放招聘数据清洗后的数据;

2023-06-07 15:46:09 930 1

原创 招聘网站—MapReduce数据清洗

利用MapReduce数据清洗本关我们主要对爬取到的招聘数据进行清洗,清洗规则如下:判断数据长度是否为 9 并判断数据字段是否完整,如有不完整字段(字段值为空),则清洗掉这一行数据;对整条数据都一样的进行去重处理;对数据字段中的城市(city)进行处理,只保留其中的市,舍弃区县,例如:深圳·南山区 -> 深圳;对数据字段中的薪资(salary)计算处理,计算规则如下:(1)mk-nk:(m+n)/2,结果保留两位小数(注意:也有可能出现 mK-nK)。

2023-06-07 15:42:09 2457

原创 电影票房之数据分析(Hive)--第5关

电影票房之数据分析(Hive)第5关:统计2020年元旦节与国庆节放假后7天的观影人数本关任务基于EduCoder平台提供的初始数据集,统计 2020 年元旦节与国庆节放假后 7 天的观影人数。编程要求本实验环境已开启Hadoop服务在 hive 中创建数据库mydb;注意:在开始要求2之前,建议您提前查看数据库中是否存在 moviecleaned 表(在环境没销毁的情况下,第一关的导入的数据可以持续使用)。如果不存在请按要求2执行,同时注意数据不要重复插入,否则可能影响后续统计的准

2023-06-07 15:37:05 1862

原创 电影票房之数据分析(Hive)--第4关

电影票房之数据分析(Hive)--第4关。本关任务基于EduCoder平台提供的初始数据集,统计 2020 年首映的电影上映后 7 天的电影票房信息。编程要求本实验环境已开启Hadoop服务在 hive 中创建数据库mydb;注意:在开始要求2之前,建议您提前查看数据库中是否存在 moviecleaned 表(在环境没销毁的情况下,第一关的导入的数据可以持续使用)。如果不存在请按要求2执行,同时注意数据不要重复插入,否则可能影响后续统计的准确性。在mydb中创建moviecle

2023-06-07 15:33:14 928

原创 电影票房之数据分析(Hive)--第3关

第3关:统计2020年中当日综合总票房最多的10天本关任务基于EduCoder平台提供的初始数据集,统计 2020 年中当日综合总票房最多的 10 天及其当日综合总票房。编程要求本实验环境已开启Hadoop服务在 hive 中创建数据库mydb;注意:在开始要求2之前,建议您提前查看数据库中是否存在 moviecleaned 表(在环境没销毁的情况下,第一关的导入的数据可以持续使用)。如果不存在请按要求2执行,同时注意数据不要重复插入,否则可能影响后续统计的准确性。在mydb中创

2023-06-07 15:30:56 669

原创 电影票房之数据分析(Hive)-- 第2关

第2关:统计2020年国庆假期中电影票房增长最多的三部电影及其每日的票房数据。本关任务基于EduCoder平台提供的初始数据集,统计国庆假期中电影票房增长最多的三部电影及其每日的票房数据。编程要求本实验环境已开启Hadoop服务在 hive 中创建数据库mydb;注意:在开始要求2之前,建议您提前查看数据库中是否存在 moviecleaned 表(在环境没销毁的情况下,第一关的导入的数据可以持续使用)。如果不存在请按要求2执行,同时注意数据不要重复插入,否则可能影响后续统计的准确性。

2023-06-07 15:28:33 981

原创 电影票房之数据分析(Hive)--第1关

电影票房之数据分析(Hive)第1关:统计2020年上映的电影中,当前总票房最高的10部电影。电影票房之数据分析(Hive)第1关:统计2020年上映的电影中,当前总票房最高的10部电影本关任务基于EduCoder平台提供的初始数据集,统计 2020 年上映的电影中,当前总票房最高的 10 部电影。编程要求本实验环境已开启Hadoop服务在 hive 中创建数据库 mydb;在 mydb 中创建 moviecleaned 表,将数据集movies.txt导入 moviecleaned 表中。

2023-05-24 15:26:26 1218

原创 电影票房之数据清洗(MapReduce)

电影票房之数据清洗(MapReduce)第1关:数据清洗任务描述基于EduCoder平台提供的初始数据集(数据集存放在 /data/workspace/myshixun/data/movies.csv 中),按照下面的要求,完成电影票房数据的清洗工作。编程要求去掉字段“上映天数”中带有“零点场”、“点映”、“展映”和“重映”的电影数据;以字段“上映天数”和“当前日期”为依据,在尾列添加一个“上映日期”(releaseDate)的字段,该字段值为“当前日期”减去“上映天数”+1

2023-05-22 09:44:38 1929 1

原创 共享单车之数据分析-统计共享单车每天的平均使用时间

任务描述本关任务:使用的对已经存在 Hbase 的共享单车运行数据进行分析,统计共享单车每天的平均使用时间,其中共享单车运行数据在的表中(表结构可在编程要求中进行查看)。相关知识为了完成本关任务,你需要掌握:如何配置的类是运行在上的一个并行计算框架,分为节点和节点。提供了的和两个方法来完成的配置。initTableMapperJob 方法: initTableReducerJob 方法:

2023-05-22 09:32:54 1730

原创 共享单车之数据存储-保存共享单车数据

我们可以通过类加载器加载共享单车数据文件。文件中获取共享单车数据,保存到。将无效数据或非法数据进行抛出。说明:由于数据过多,我们将输出。开始你的任务吧,祝你成功!类封装了对应的批量存储到。共享单车数据结构和获取。根据提示,在右侧编辑器。目的地 = 所在城市。

2023-05-22 09:30:51 731 1

原创 共享单车之数据存储-获取工作簿中的数据

表中有非法数据,我们在获取时为了避免出错或者获取到空的数据,可以使用。为了完成本关任务,你需要掌握:如何获取。获取工作簿中的信息,我们可以使用。格式档案读和写的功能)提供的。、开始时间、结束经度、车辆。

2023-05-22 09:28:16 516

原创 CSS 简介&三种样式写法

添加css样式三种方法:行内样式、内部样式、外部样式。

2022-09-18 15:07:38 425

原创 VS Code 常用快捷键

VS Code 常用快捷键1、快速生成HTML代码首先,建立一个空文档,选择编程语言为HTML;其次,按下!(英文状态下),再按下tab键,就可以了。也可以html:52、注释单行注释:ctrl+/,注释后再按取消;取消单行注释:alt+shift+A注释后再按取消3、移动行  向上移动一行:alt+up;向下移动一行:alt+down4、显示/隐藏左侧目录栏ctrl+b5、复制当前行向上复制一行:s

2022-09-11 15:43:06 811

原创 Java--高精度加减乘除取余模板

import java.util.Scanner;import java.math.BigDecimal;import java.math.BigInteger;class Main{ public static void main(String[] args){ Scanner cin = new Scanner(System.in); BigInteger a, b; String s1 = "a + b = ", s2 = "a - b.

2022-05-13 17:13:05 353

原创 MySQL--子查询相关操作

查询没有选修05203314号课程的学生姓名、学生专业。查询与‘丁志杰’在同一个专业学习的学生学号、姓名和性别。查询选修‘信工’学院开设课程的学生学号及成绩。select stu_id,gradefrom scorewhere cs_id in(select cs_id from course where cs_depart='信工');查询与‘王芳’老师讲授同一门课的老师的教师编号和教师姓名。SELECT distinct teacher.tea_id,tea_na..

2022-05-08 17:29:21 2158 2

原创 MySQL--管理数据库表相关操作

1.修改student 表名为stu;2.把stu表名改为student;3.修改student表的sage属性名为birthday,数据类型改为date;4.修改student表的sdept数据类型为varchar(30);5.给student表添加属性sxj(学籍),类型为varchar(30),且位置在sage之后;6.给student表的主键约束删除7.添加sc表的外键fk_cour,外键是cno,参照course表的cno8.删除sc表的外键

2022-05-08 17:23:07 1043

原创 【CodeForces - 1624B】Make AP (简单找规律&详解)

Make APCodeForces - 1624BPolycarp has33positive integersaa,bbandcc. He can perform the following operationexactly once.Choose apositiveintegermmand multiplyexactly oneof the integersaa,bborccbymm.Can Polycarp make it so that after...

2022-04-30 18:30:27 861

原创 【CodeForces - 1660B 】Vlad and Candies(简单写法)

Vlad and CandiesCodeForces - 1660BNot so long ago, Vlad had a birthday, for which he was presented with a package of candies. There werenntypes of candies, there area_iai​candies of the typeii(1 \le i \le n1≤i≤n).Vlad decided to eat exactly o...

2022-04-30 14:55:26 831

原创 AcWing 3465. 病毒朔源 (邻接表&DFS 详解)

来源:CCCC天梯赛L2-038病毒容易发生变异。某种病毒可以通过突变产生若干变异的毒株,而这些变异的病毒又可能被诱发突变产生第二代变异,如此继续不断变化。现给定一些病毒之间的变异关系,要求你找出其中最长的一条变异链。在此假设给出的变异都是由突变引起的,不考虑复杂的基因重组变异问题 —— 即每一种病毒都是由唯一的一种病毒突变而来,并且不存在循环变异的情况。输入格式输入在第一行中给出一个正整数NN,即病毒种类的总数。于是我们将所有病毒从00到N−1N−1进行编号。随后N...

2022-04-19 16:39:27 329

原创 AcWing 826. 单链表 (模板题 链表)

实现一个单链表,链表初始为空,支持三种操作:向链表头插入一个数;删除第 k 个插入的数后面的数;在第 k 个插入的数后插入一个数。现在要对该链表进行 M 次操作,进行完所有操作后,从头到尾输出整个链表。注意:题目中第 k 个插入的数并不是指当前链表的第 k 个数。例如操作过程中一共插入了 n 个数,则按照插入的时间顺序,这 n 个数依次为:第 1 个插入的数,第 2 个插入的数,…第 n 个插入的数。输入格式第一行包含整数 M,表示操作次数。接下来 M 行,每行包含一个操作命令,操作命令可能

2022-04-18 18:54:53 271

原创 【CCCC天梯赛L2-037】包装机 (队列&栈)

来源:CCCC天梯赛L2-037一种自动包装机的结构如图11所示。首先机器中有NN条轨道,放置了一些物品。轨道下面有一个筐。当某条轨道的按钮被按下时,活塞向左推动,将轨道尽头的一件物品推落筐中。当00号按钮被按下时,机械手将抓取筐顶部的一件物品,放到流水线上。图22显示了顺序按下按钮3、2、3、0、1、2、03、2、3、0、1、2、0后包装机的状态。图11自动包装机的结构图22顺序按下按钮3、2、3、0、1、2、03、2、3、0、1、2、...

2022-04-17 15:59:34 184

原创 【第十三届蓝桥杯省赛B组】统计子矩阵 (枚举&前缀和+双指针)

来源:第十三届蓝桥杯省赛C++B组给定一个N×MN×M的矩阵AA,请你统计有多少个子矩阵 (最小1×11×1,最大N×MN×M) 满足子矩阵中所有数的和不超过给定的整数KK?输入格式第一行包含三个整数N,MN,M和KK。之后NN行每行包含MM个整数,代表矩阵AA。输出格式一个整数代表答案。数据范围对于30%30%的数据,N,M≤20N,M≤20,对于70%70%的数据,N,M≤100N,M≤100,对于100%100%的数据,1≤N...

2022-04-16 17:53:27 3694

原创 AcWing 796. 子矩阵的和 (前缀和)

输入一个 nn 行 mm 列的整数矩阵,再输入 qq 个询问,每个询问包含四个整数 x1,y1,x2,y2x1,y1,x2,y2,表示一个子矩阵的左上角坐标和右下角坐标。对于每个询问输出子矩阵中所有数的和。输入格式第一行包含三个整数 n,m,qn,m,q。接下来 nn 行,每行包含 mm 个整数,表示整数矩阵。接下来 qq 行,每行包含四个整数 x1,y1,x2,y2x1,y1,x2,y2,表示一组询问。输出格式共 qq 行,每行输出一个询问的结果。数据范围1≤n,m≤1

2022-04-15 19:07:01 445

原创 修剪灌木(模拟找规律-两种简单写法)

来源:第十三届蓝桥杯省赛C++B组爱丽丝要完成一项修剪灌木的工作。有 NN 棵灌木整齐的从左到右排成一排。爱丽丝在每天傍晚会修剪一棵灌木,让灌木的高度变为 00 厘米。爱丽丝修剪灌木的顺序是从最左侧的灌木开始,每天向右修剪一棵灌木。当修剪了最右侧的灌木后,她会调转方向,下一天开始向左修剪灌木。直到修剪了最左的灌木后再次调转方向。然后如此循环往复。灌木每天从早上到傍晚会长高 11 厘米,而其余时间不会长高。在第一天的早晨,所有灌木的高度都是 00 厘米。爱丽丝想知道每棵灌木

2022-04-11 12:47:44 3542 1

原创 试题 历届试题 单词分析【第十一届】【省赛】(map)

来源:第十一届蓝桥杯省赛第二场C++C组,第十一届蓝桥杯省赛第二场JAVAB/C组小蓝正在学习一门神奇的语言,这门语言中的单词都是由小写英文字母组成,有些单词很长,远远超过正常英文单词的长度。小蓝学了很长时间也记不住一些单词,他准备不再完全记忆这些单词,而是根据单词中哪个字母出现得最多来分辨单词。现在,请你帮助小蓝,给了一个单词后,帮助他找到出现最多的字母和这个字母出现的次数。输入格式输入一行包含一个单词,单词只由小写英文字母组成。输出格式输出两行,第一行包含一个英文字母,表示单

2022-04-05 16:30:58 124

原创 试题 历届真题 外卖店优先级【第十届】【省赛】(模拟)

来源:第十届蓝桥杯省赛C++A/C组,第十届蓝桥杯省赛JAVAA/B/C组“饱了么”外卖系统中维护着 N 家外卖店,编号 1∼N。每家外卖店都有一个优先级,初始时 (0 时刻) 优先级都为 0。每经过 1 个时间单位,如果外卖店没有订单,则优先级会减少 1,最低减到 0;而如果外卖店有订单,则优先级不减反加,每有一单优先级加 2。如果某家外卖店某时刻优先级大于 5,则会被系统加入优先缓存中;如果优先级小于等于 3,则会被清除出优先缓存。给定 T 时刻以内的 M 条订单信息,请你计算 T 时刻时有多

2022-04-05 16:10:26 239

原创 AcWing 3490. 小平方 (枚举)

来源:第十二届蓝桥杯省赛第二场C++A/B组小蓝发现,对于一个正整数nn和一个小于nn的正整数vv,将vv平方后对nn取余可能小于nn的一半,也可能大于等于nn的一半。请问,在11到n−1n−1中,有多少个数平方后除以nn的余数小于nn的一半。例如,当n=4n=4时,1,2,31,2,3的平方除以44的余数都小于44的一半。又如,当n=5n=5时,1,41,4的平方除以55的余数都是11,小于55的一半。而2,32...

2022-04-05 13:29:20 490

原创 AcWing 3491. 完全平方数 (分解质因数)

来源:第十二届蓝桥杯省赛第二场C++A/B组AcWing 3491. 完全平方数一个整数aa是一个完全平方数,是指它是某一个整数的平方,即存在一个整数bb,使得a=b2a=b2。给定一个正整数nn,请找到最小的正整数xx,使得它们的乘积是一个完全平方数。输入格式输入一行包含一个正整数nn。输出格式输出找到的最小的正整数xx。数据范围对于30%30%的评测用例,1≤n≤10001≤n≤1000,答案不超过10001000。对于60%60%的评测用...

2022-03-31 15:54:19 1974 2

原创 AcWing 2548. 大胖子走迷宫 (BFS)

来源:第十届蓝桥杯国赛C++A/C/研究生组小明是个大胖子,或者说是个大大胖子,如果说正常人占用1×11×1的面积,小明要占用5×55×5的面积。由于小明太胖了,所以他行动起来很不方便。当玩一些游戏时,小明相比小伙伴就吃亏很多。小明的朋友们制定了一个计划,帮助小明减肥。计划的主要内容是带小明玩一些游戏,让小明在游戏中运动消耗脂肪。走迷宫是计划中的重要环节。朋友们设计了一个迷宫,迷宫可以看成是一个由n×nn×n个方阵组成的方阵,正常人每次占用方阵中1×11×1的区域...

2022-03-31 14:03:23 251

原创 AcWing 2067. 走方格 (两种写法 -- dp&记忆化搜索)

AcWing 2067. 走方格来源:第十一届蓝桥杯省赛第一场C++A/B组在平面上有一些二维的点阵。这些点的编号就像二维数组的编号一样,从上到下依次为第 11 至第 nn 行,从左到右依次为第 11 至第 mm 列,每一个点可以用行号和列号来表示。现在有个人站在第 11 行第 11 列,要走到第 nn 行第 mm 列。只能向右或者向下走。注意,如果行号和列数都是偶数,不能走入这一格中。问有多少种方案。输入格式输入一行包含两个整数 n,mn,m。输出格式输出一个整

2022-03-28 17:04:23 222

原创 AcWing 2066. 解码 (字符串模拟)

来源:第十一届蓝桥杯省赛第一场C++A/B组小明有一串很长的英文字母,可能包含大写和小写。在这串字母中,有很多连续的是重复的。小明想了一个办法将这串字母表达得更短:将连续的几个相同字母写成字母 + 出现次数的形式。例如,连续的 55 个 aa,即 aaaaaaaaaa,小明可以简写成 a5a5(也可能简写成 a4aa4a、aa3aaa3a 等)。对于这个例子:HHHelllllooHHHellllloo,小明可以简写成 H3el5o2H3el5o2。为了方便表达,小明不会将连续的超过

2022-03-27 17:07:39 144

原创 AcWing 2065. 整除序列 (二进制模拟)

第十一届蓝桥杯省赛第一场C++B组有一个序列,序列的第一个数是 nn,后面的每个数是前一个数整除 22,请输出这个序列中值为正数的项。输入格式输入一行包含一个整数 nn。输出格式输出一行,包含多个整数,相邻的整数之间用一个空格分隔,表示答案。数据范围1≤n≤10181≤n≤1018输入样例:20输出样例:20 10 5 2 1AC#include<stdio.h>int main(void){ long long n; sca

2022-03-27 16:42:12 257

原创 AcWing 1245. 特别数的和 (暴力模拟)

来源:第十届蓝桥杯省赛C++B组,第十届蓝桥杯省赛JAVAB组小明对数位中含有 2、0、1、92、0、1、9 的数字很感兴趣(不包括前导 00),在 11 到 4040 中这样的数包括 1、2、9、101、2、9、10 至 32、3932、39 和 4040,共 2828 个,他们的和是 574574。请问,在 11 到 nn 中,所有这样的数的和是多少?输入格式共一行,包含一个整数 nn。输出格式共一行,包含一个整数,表示满足条件的数的和。数据范围1≤n≤100001≤n≤

2022-03-27 16:09:02 631

原创 【51Nod - 2201】做任务一 (贪心)

51Nod - 2201B君和m个人一起,要完成n个任务,在这个题中,m个人会看着这B君,自己什么都不做。第i个任务有一个开始时间s[i]和结束时间e[i](保证s[i]<=e[i]),一个人完成两个任务的时间区间,不能有交集,但是可以首尾相连。(参考样例)换句话说,如果一个人依次完成了(s[1], e[1]) (s[2], e[2]) (s[3], e[3])这3个任务,那么这3个任务需要满足s[1]<=e[1]<=s[2]<=e[2]<=s[3]<=e[3

2022-03-25 13:39:49 97

原创 【51Nod - 2206】 低买高卖 (贪心&优先队列 详解)

51Nod - 2206考虑股票市场上的某一只股票,一共有nn天。对于第ii天,BB君知道股票的价格是每单位a[i]a[i]元在每一天,BB君可以选择买入一个单位的股票,或卖出一个单位的股票,或者什么都不做。刚开始BB君有无穷多的钱,但是没有任何股票。问nn天之后BB君最多可以赚多少钱。Input第一行一个整数n表示天数。(1 <= n <= 200000,1 <= a[i] <= 10000) 接下来一行n个整数,表示每天的价钱。O...

2022-03-25 12:35:53 639

原创 AcWing 95. 费解的开关 (递归&位运算 详解)

你玩过“拉灯”游戏吗?2525盏灯排成一个5×55×5的方形。每一个灯都有一个开关,游戏者可以改变它的状态。每一步,游戏者可以改变某一个灯的状态。游戏者改变一个灯的状态会产生连锁反应:和这个灯上下左右相邻的灯也要相应地改变其状态。我们用数字11表示一盏开着的灯,用数字00表示关着的灯。下面这种状态1011101101101111000011011在改变了最左上角的灯的状态后将变成:0111111101101111000011011...

2022-03-21 18:22:56 5835

原创 AcWing 94. 递归实现排列型枚举 (两种写法 - stl&递归)

把 1∼n1∼n 这 nn 个整数排成一行后随机打乱顺序,输出所有可能的次序。输入格式一个整数 nn。输出格式按照从小到大的顺序输出所有方案,每行 11 个。首先,同一行相邻两个数用一个空格隔开。其次,对于两个不同的行,对应下标的数一一比较,字典序较小的排在前面。数据范围1≤n≤91≤n≤9输入样例:3输出样例:1 2 31 3 22 1 32 3 13 1 23 2 1AC1 stl#include<stdio.h>.

2022-03-20 16:45:29 95 1

原创 AcWing 92. 递归实现指数型枚举 (递归)

从 1∼n1∼n 这 nn 个整数中随机选取任意多个,输出所有可能的选择方案。输入格式输入一个整数 nn。输出格式每行输出一种方案。同一行内的数必须升序排列,相邻两个数用恰好 11 个空格隔开。对于没有选任何数的方案,输出空行。本题有自定义校验器(SPJ),各行(不同方案)之间的顺序任意。数据范围1≤n≤151≤n≤15输入样例:3输出样例:322 311 31 21 2 3AC#include<stdio.h>

2022-03-20 14:40:24 294

原创 【计蒜客 - A2240】程序设计:轻重搭配 (贪心)

n个同学去动物园参观,原本每人都需要买一张门票,但售票处推出了一个优惠活动,一个体重为xx的人可以和体重至少为2x2x配对,这样两人只需买一张票。现在给出了nn个人的体重,请你计算他们最少需要买几张门票?输入格式第一行一个整数nn,表示人数。第二行nn个整数,每个整数a_iai​表示每个人的体重。输出格式一个整数,表示最少需要购买的门票数目。数据范围对于30\%30%的数据:1 \le n \le 251≤n≤25,1\le a_i \le 1001≤...

2022-03-20 11:36:11 123 1

原创 【计蒜客 - A2239】后缀字符串 (简单map)

一天蒜头君得到 nn 个字符串 s_isi​,每个字符串的长度都不超过 1010。蒜头君在想,在这 nn 个字符串中,以 s_isi​ 为后缀的字符串有多少个呢?输入格式第一行输入一个整数 nn。接下来 nn 行,每行输入一个字符串 s_isi​。输出格式输出 nn 个整数,第 ii 个整数表示以 s_isi​ 为后缀的字符串的个数。数据范围对于 50\%50% 的数据,1 \le n \le 10^31≤n≤103。对于 100\%100% 的数据,1 \le n \l

2022-03-20 11:11:36 99

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除