
scala
一代码动乾坤
目前主攻大数据领域的专家。熟悉DSP,DMP等常见在线广告体系、视频新媒体、下线实体数字化、企业级数据管理、数据治理、AI等领域有深耕。最终目标成为一名全栈代码扫地僧。望与大家共勉,一起将快乐代码做成终生事业!
展开
-
余弦相似度-字符串相似度计算(scala)
余弦相似度-字符串相似度计算(scala)代码实现原创 2022-06-02 15:21:23 · 445 阅读 · 0 评论 -
Flink如何自定义Redis的Sink
背景Flink 默认的 RedisMapper 不能设置key的过期时间。依赖<dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <version>2.9.0</version></dependency>SinkFunction & RichSinkFunct转载 2020-09-16 16:13:39 · 339 阅读 · 0 评论 -
scala怎么取绝对值
scala怎么取绝对值调用 .abs 方法object t_main { def main(args: Array[String]): Unit = { val a= -1 println(a) println(a.abs) }}结果原创 2020-09-15 14:29:38 · 2658 阅读 · 0 评论 -
flink的三种sink(redis,es,mysql)
一、redis sink对应jar包<dependency> <groupId>org.apache.bahir</groupId> <artifactId>flink-connector-redis_2.11</artifactId> <version>1.0</version></dependency>将文件内容写入到hash中代码: 1 2原创 2020-09-15 14:18:18 · 623 阅读 · 0 评论 -
spark开发中的Zip算子灵活使用
本人开发中,需要聚合的文段举个栗子:RDD中有如下元素k v((a,b),List(7,8,9))((a,b),List(1,2,3))((a,b),List(4,5,6))((c,d),List(4,5,6))。。。。。。reducebyke后要对v 操作原理将v 中的list 前后zip 再map 每个元素进行 逐个元组元素(口,口)的累加。a代表...原创 2018-12-04 22:14:48 · 2288 阅读 · 0 评论 -
Spark分区
默认分区和HashPartitioner分区默认的分区就是HashPartition分区,默认分区不再介绍,下面介绍HashPartition的使用通过上一章 mapPartitionsWithIndex的例子,我们可以构建一个方法,用来查看RDD的分区def mapPartIndexFunc(i1:Int,iter: Iterator[(Int,Int)]):Iterator[(Int,(...转载 2018-12-06 23:54:47 · 359 阅读 · 0 评论 -
为什么不建议在 HBase 中使用过多的列族
我们知道,一张 HBase 表包含一个或多个列族。HBase 的官方文档中关于 HBase 表的列族的个数有两处描述:A typical schema has between 1 and 3 column families per table. HBase tables should not be designed to mimic RDBMS tables. 以及 HBase currently...原创 2019-01-09 23:12:36 · 330 阅读 · 0 评论 -
Spark -SQL中重分区增大or减少并行度
Spark SQL 查询中 Coalesce 和 Repartition 暗示(Hint)如果你使用SparkRDD 或者 DataFrame 编写程序,我们可以通过coalesce或repartition来修改程序的并行度: val data = sc.newAPIHadoopFile(xxx).coalesce(2).map(xxxx) 或 va...原创 2019-05-06 19:02:07 · 1378 阅读 · 0 评论 -
Scala 将时间戳转成指定时区的时间(UTC时间)
package import java.text.SimpleDateFormatimport java.util.{Calendar, Date, TimeZone}object Test { def main(args: Array[String]): Unit = { val time2: Double = 1554506596858d; //换成0失去 va...转载 2019-05-22 23:57:45 · 2244 阅读 · 0 评论