自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 IntelliJ IDEA 安装-Spark

Maven(apache-maven-3.6.3)安装目录->conf文件见,打开settings.xml文件,配置本地仓库。在src/main/resources下,新建log4j.properties文件。5.添加依赖pom.xml。

2024-07-02 11:28:30 718

原创 数据分析与挖掘-Kmeans算法-2.Kmeans轮廓系数

数据分析与挖掘-2.Kmeans轮廓系数

2024-06-29 22:27:31 149

原创 数据分析与挖掘-Kmeans算法-1.聚类算法之Kmeans算法原理

数据分析与挖掘-1.聚类算法之Kmeans算法原理

2024-06-29 21:52:35 166

原创 数据分析与挖掘-KNN算法-3模型评估之样本集拆分-拆分策略-优化

数据分析与挖掘-KNN算法-3模型评估之样本集拆分-拆分策略-优化

2024-06-29 18:01:28 110

原创 数据分析与挖掘-KNN算法-2.K值选择问题-模型评估

数据分析与挖掘-KNN算法-2.K值选择问题-模型评估

2024-06-29 17:58:39 158

原创 数据分析与挖掘-KNN算法-1.分类算法

数据分析与挖掘-KNN算法-1.分类算法

2024-06-29 17:56:00 284

原创 Spark 练习题-成绩统计

【代码】Spark 练习题-成绩统计。

2024-06-26 11:12:55 152

原创 Spark 练习题-自定义分区

【代码】Spark 练习题-自定义分区。

2024-06-26 10:46:00 196

原创 Spark 练习题-每个省广告点击Top3

【代码】Spark 练习题-每个省广告点击Top3。

2024-06-26 09:57:47 108

原创 Spark 练习题-Top10热门品类

【代码】Spark 练习题-Top10热门品类。

2024-06-26 09:53:43 151

原创 requests 爬取json格式的数据

【代码】requests 爬取json格式的数据。

2024-01-12 00:45:23 607 1

原创 requests 用类方法爬取数据

【代码】requests 用类方法爬取数据。

2024-01-11 22:19:40 409

原创 hive分区分桶

sorted by (score DESC )#排序 into 4 buckets #分4桶。partitioned by (years string) #分区。clustered by (types) #分桶字段。

2024-01-10 12:37:26 447

原创 hive-Java-连接Apl-UDF函数

3、设置\apache-maven-3.6.1\conf路径下的settings.xml文件,添加localRepository的路径2、在文件apache-maven-3.6.1里创建localRepository,将c0cd3630-8531-11ee-88a5-53ea2a688f3a文件解压到localRepository中。//com.hiveudf包名 Upper类名。1、解压apache-maven-3.6.1到A里。

2024-01-10 12:36:17 424

原创 hive数据迁移和数据分析

数据库:movie 主机:192.168.121.130。账号:itcast 密码:123456。新建文件---添加数据表---创建主题分析。在外[root@master ~]#端口:3306 用户:root。13、finedb激活码。14、在MySQL中。

2024-01-10 12:34:54 391

原创 scala练习

【代码】scala练习。

2024-01-10 11:24:29 378

原创 Scala 商品订单计算统计

每个订单的商品列表(包含哪些商品)# 统计未支付的订单数量。# 找出消费最多的客户。# 每个订单的总金额。

2024-01-06 21:21:48 879 2

原创 scala 词频统计

【代码】scala 词频统计。

2023-12-28 21:53:11 576 1

原创 scala 词频统计

【代码】scala 词频统计。

2023-12-28 19:33:22 370 1

原创 scala 订单查询

【代码】scala 订单查询。

2023-12-28 17:20:57 418 1

原创 1、scala 计算每天最多的城市

【代码】1、scala 计算每天最多的城市。

2023-12-28 17:12:47 395 1

原创 2.requests 用for循环爬取“下一页”和“详情页”的内容并保存图片和文字(csv文件)

【代码】2.requests 用for循环爬取“下一页”和“详情页”的内容并保存图片和文字(csv文件)

2023-12-27 22:05:15 500 1

原创 1.requests 爬取(多页)文字和图片并保存为csv文件

【代码】1.requests 爬取(多页)文字和图片并保存为csv文件。

2023-12-27 21:14:38 500 1

Spark 练习题-数据

Spark 练习题-数据

2024-06-26

Python requests 爬虫

Python requests 爬虫

2024-01-12

管理系统练习.zip555

管理系统练习.zip555

2024-01-10

hive.ziphive数据迁移和数据分析

hive.ziphive数据迁移和数据分析

2024-01-10

scala练习使用Scala统计每日新增最多的城市 统计未支付的订单数量词频统计

scala练习使用Scala统计每日新增最多的城市 统计未支付的订单数量词频统计

2024-01-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除