自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 Spark影评数据分析

Spark影评数据分析 一、数据来源 网址:https://grouplens.org/datasets/movielens/ 二、数据结构分析 本次所分析的数据有用户、电影、评分三个表,结构如下: 1.用户表 字段名 类型 备注 用户ID String 性别 String “M” for male and “F” for female 年龄 Int * 1: “Under 18” * 18: “18-24” * 25: “25-34” * 35: “35-44” * 45: “45-49”

2021-03-31 10:53:42 876

原创 Spark编程实训

实训1:统计文本中性别为“男”的用户数 训练要点 (1) 读取数据创建RDD。 (2) 通过filter操作过滤数据,filter的函数判断数据是否包含“男”字符,可用“contains”方法。 (3) 用count对步骤(2)的结果进行统计,得到行数 import org.apache.spark.{SparkConf, SparkContext} object SparkPi { def main(args: Array[String]): Unit = { val conf = new

2021-03-24 16:41:07 3063

原创 输入任意省份,输出这个省份号码段的个数,电信、移动、联通各占多少个。

Scala实验:根据2016phonelocation,编写程序实现如下功能。 运行程序,用户输入任意省份,输出这个省份号码段的个数,电信、移动、联通各占多少个。 import java.util.Scanner import scala.io.Source object Phone { def main(args: Array[String]): Unit = { //从键盘读入省份,可以用next() or nextLine() val scan = new Scanner(Syst

2021-03-10 11:43:13 823

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除