自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 数值类型。

2025-06-09 22:19:17 107

原创 collect和take操作

2025-06-09 22:18:44 113

原创 kafka安装与测试

测试kafka的消息生产和消费 在A终端随便输入几行B终端就会看到。修改kafka目录的所属用户和组为spark:spark。到/usr/local 创建软链接kafka。测试nc端和客户端互发数据。zookeeper服务。

2025-06-09 22:17:47 201

原创 SparkStreaming通话记录消息处理

(2)打开一个Linux终端窗体,在其中输入下面的命令,将消息接收者程序提交到Spark中运行,其中用到的spark-streaming-kafka-0-8-assembly_2.11-2.4.8.jar依赖库文件此前已下载放在~/streaming目录中,为避免每次提交应用程序时在命令行手动指定,可以将其复制到集群的各节点Spark安装目录中(位于/usr/local/spark/jars目录)从输出结果可以清楚地看到,接收的Kafka消息是一系列(K,V)键值对形式的二元组,其中的K代表。

2025-06-08 17:24:01 1460

原创 keys和values操作

2025-06-08 17:22:37 68

原创 reduceByKey合并数据

2025-06-08 17:22:07 102

原创 subtract数据减集

2025-06-08 17:21:30 90

原创 intersection数据交集

2025-06-08 17:21:00 110

原创 Spark环境搭建与配置

输入密码spark,回车,在弹出的窗口点击no(不保存登陆密码),进入下图中的页面后,可以直接在红圈处输入linux命令,还可以通过左侧SFTP 将Windows 本地的文件上传到远程服务器。(如果失败,后面弹出红色字exit,关闭这个界面,注意不是这个系统界面,是黑色框的界面,点击确定,然后再双击自己的ip,再次输入密码,就成功了)将MobaXterm便携版解压缩到Windows的一个目录中,然后启动里面的MobaXterm_Personal可执 行文件,就会打开MobaXterm窗体的初始界面。

2025-06-08 17:20:10 1549

原创 mapValues和flatMapValues操作

2025-06-08 17:17:52 107

原创 union合并数据

2025-06-08 17:17:17 70

原创 groupby分组数据

2025-06-08 17:16:41 68

原创 spark 知识概括

Row(id='12', name='宋江', age=25, gender='男', object='chinese', score=50), Row(id='12', name='宋江', age=25, gender='男', object='math', score=60)]rdd = sc.parallelize([1,2,3,6,5,4,6,12,23]).groupBy(lambda x:x%3) #将元素分成3组,第一组x%3==0,第二组x%3==1,第三组x%3==2。

2025-06-08 17:15:53 1454

原创 distinct去重数据

2025-06-08 17:14:57 82

原创 启动集群命令

2025-06-08 17:14:06 98

原创 filter筛选数据

2025-06-08 17:12:23 69

原创 RDD的转换操作

2025-06-08 17:10:48 81

原创 mysql启动

2025-06-08 17:08:11 91

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除