
题目整理
不想当和尚
这个作者很懒,什么都没留下…
展开
-
微小型数仓案例整理
一、MySQL导入数据数仓是建立在 hive 上,有两层(ODS 层 rds 库)和 DW 层(tds 库),存储格式日期维度 textfile,其他 orc。可使用命令导入sql文件。建mysql表语句:CREATE DATABASE IF NOT EXISTS sales_source DEFAULT CHARSET utf8 COLLATE utf8_general_ci; USE sales_source;DROP TABLE IF EXISTS customer;DROP TABL原创 2020-09-03 16:02:28 · 420 阅读 · 0 评论 -
Spark初级题目练习
一、有以下两个文件,字段分别为:orderid(订单ID),userid(用户ID),payment(支付金额),productid(商品ID)。使用Spark完成以下需求。file1.txt1,1768,50,1552,1218,600,2113,2239,788,2424,3101,28,5995,4899,290,1296,3110,54,12017,4436,259,8778,2369,7890,27file2.txt100,4287,226,233101,6562,4原创 2020-08-21 14:02:08 · 1391 阅读 · 0 评论 -
Spark题目练习
建表:private val schema = StructType(Array( StructField("student_id", IntType, true), StructField("student_name", StringType, true), StructField("birth", StringType, true), StructField("sex", StringType, true) ))val rdd = sc.makeRDD(Array原创 2020-08-17 17:17:04 · 352 阅读 · 0 评论