- 博客(13)
- 收藏
- 关注
原创 操作系统概念复习
管理计算机硬件与软件资源的计算机程序,提供其他程序和硬件之间的接口对需求进行管理,对资源进行分配,对用户提供服务,是计算机软硬件的总指挥部。在操作系统中,是指一个时间段中有几个程序都处于运行到运行完毕之间,且这几个程序都是在同一个处理机上运行,但任一个时刻点上只有一个程序在处理机上运行。一个可并发执行的、具有功能的程序关于某数据集合的一次执行过程,也是操作系统进行资源分配和调度的独立单位。进程的特征:动态性、并发性、独立性、异步性、结构性。进程与线程的关系进程调度是操作系统中最基本的一种调度一种用于控制
2023-12-19 10:34:05
177
1
原创 每天一道简单算法题之密码解译#C
题目描述有一行电文,已按下面规律译成密码:即第1个字母变成第26个字母,第 i 个字母变成第( 26 - i - 1 )个字母,非字母字符不变。要求分析这道题目主要操作就是对字符的更改。通过ASCII查找发现,字符 ‘a’ 和字符 ‘z’ 对应的ASCII值为97和122,实现字符的变更其实就是对字符对应的ASCII值进行更改。及字符 ‘a’ 如想变更为字符 ‘z’ 则字符 ‘a’ +=25,此时的字符 ‘a’ 就变成字符 ‘z’。 根据所给的公式得到以下两公式:详情代码#include
2022-03-24 20:36:54
1296
原创 Spark对数据进行清洗,将数据保存到本地并写入Mysql数据库 | 案例
通过编写Spark程序统计各城市的住宿场所数量和房间数量,并根据城市房间数量降序排列,输出前10条统计结果,将统计结果保存至本地。同时在MySQL创建数据库并在其中创建table3_2,将统计结果写入表table3_2中。要求输出字段包含:省份、城市、住宿场所数量、房间数量。原数据Spark源代码import org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}import java.sql.{Conn
2022-02-28 12:48:04
5437
2
原创 Spark解析json文件,实现跳跃顺序排序
目的要求根据order值进行跳跃顺序排序,生成seq字段,同时生成索引值。跳跃顺序排序如order值相同,则排序是一样的,下一个排序会跳过,例如第1条数据的order值和第 2 条的值不同,第2条的order值与后2条的值相同,第4条数据的order值和第 5 条的值不同,则排序的 seq 值为 1,2,2,2,5。数据格式代码实现**内有详情注释import com.alibaba.fastjson.{JSON, JSONObject}import org.apache.spark.r
2022-01-05 10:15:55
1072
原创 [ Spark ml ] 线性回归LinearRegression案例
案例实现**内有详情备注import org.apache.spark.ml.linalg.Vectorsimport org.apache.spark.ml.regression.{LinearRegression, LinearRegressionModel, LinearRegressionTrainingSummary}import org.apache.spark.sql.{DataFrame, SparkSession}object linearregression { def
2022-01-04 10:43:09
1744
原创 The server time zone value ‘�й���ʱ��‘ is unrecognized or represents more than one time zone......
spark写入mysql报错如下Caused by :com.mysql.cj.exceptions.InvalidConnectionAttributeException: The server time zone value ‘�й���ʱ��’ is unrecognized or represents more than one time zone. You must configure either the server or JDBC driver (via the ‘serverTime
2022-01-01 10:57:44
116
原创 Hive查看出租率
出租率计算公式·出租率 = 当月发生的总间夜数/当月所能提供的总房间数Hive操作·根据出租率计算表 hive_tb_1 中的酒店出租率,并根据出租率降序,将前八条写入表 hive_tb_2中。insert overwrite table default.hive_tb_2 select * from ( select city,wineshop,cast((sum(room_night)/sum(room)) as decimal(10,4)) as lease from default.h
2022-01-01 09:30:35
1061
原创 MapReduce求top实例——导入hive
目的通过对各个城市的直销拒单率,求得省份的直销拒单率,并按拒单率降序排序,取前8写入hive;数据格式实现代码和操作过程(1).编写Bean类import org.apache.hadoop.io.WritableComparable;import java.io.DataInput;import java.io.DataOutput;import java.io.IOException;public class bean implements WritableComparable&l
2021-12-16 21:58:20
2220
原创 [ Spark mllib ] 聚类K-means案例——2021挖掘
[ Spark mllib ] 聚类K-means案例——2021挖掘目的与要求数据格式数据读取与清洗聚合K-Means操作数据的再次清洗和拼接数据的输出打印完整代码最终结果目的与要求筛选北京地区(“城市”字段为“北京市”)商家数据记录形成筛选数据集。根据北京地区商家的经纬度属性,对商家进行 k-means 聚类,聚类数设为 5,迭代次数为 2000 次。打印语句输出聚类中心、每个类的商家数,以及该类所包含的商圈。(打印格式:=cluster 0: 聚类中心为[,],商家数为***个,包含商圈:【
2021-11-24 21:52:46
1608
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅