
spark
So_that
搜索策略
展开
-
常见内网IP段
常见内网IP段局域网,解决了ipv4地址不够用的问题。同时方便维护管理。局域网地址范围分三类,以下IP段为内网IP段:C类:192.168.0.0 - 192.168.255.255B类:172.16.0.0 - 172.31.255.255A类:10.0.0.0 - 10.255.255.255...原创 2018-11-14 10:27:30 · 48481 阅读 · 2 评论 -
VMware上部署Hadoop-2.8.5+Spark-2.3.0完全分布式集群
相信大多数初学者和我一样,对配置环境头疼的一批;我在这里简单介绍一下hadoop基于虚拟机的完全分布式部署;1 首先说一下我的电脑配置吧:win10操作系统;8g内存;i5六代处理器;配置越高越好吧(要不然容易卡顿);Ubuntu 16.04(这个镜像大家可以去网上下啊;之后安装什么的都比较简单就不说了)我强调一点:可以先安装一个镜像进行配置然后进行复制,这样可以减少很多重复的...原创 2018-11-20 11:40:01 · 686 阅读 · 1 评论 -
Spark-ML-UDF使用的简单介绍
最近的在学习spark,同时作业有用到spark-udf,在这里简单总结一下:下面我分别分析了udf的两种用法(当然都是针对spark2.x的)以及决策树和随机森林的使用以及交叉验证的使用。spark sql用法注册自定义函数:spark.udf.register("stringcount", protein _)使用: var date: DataFrame =spark...原创 2019-04-12 19:38:32 · 468 阅读 · 0 评论