- 博客(3)
- 收藏
- 关注
原创 java中汉字究竟占几个字节?
byte是1个字节,char是两个字节,但是char里可以存一个汉字,这么说汉字就占用两个字节?String类型里的汉字,按照编码格式的不同,分为2-4个字节的占用,UTF-8占用3个字节,特别的占用4个字节。GBK里汉字确实是占用2个字节。UTF-16里汉字一般占2个字节,特殊的是4个字节。综上所述,那要看汉字是以什么编码格式来存储了,以及汉字是否为特殊汉字。...
2018-03-17 19:04:59
3501
原创 Accumulator的使用
Accumulator:累加器 在进行相同类型的计数时,可以将Accumulator合并为1个,在一个当中实现多个Accumulator要实现的业务,同时这种方式有低耦合,易维护的优点。同时可以更方便得进行中间状态的维护,不用担心并发和锁的问题。 Accumulator就是一个累加器,在实现AccumulatorParam<T>(T可以是自定义类型)这个接口之后,实现相关方...
2018-02-25 09:31:18
4682
原创 Spark Core开发准则
1,尽量少生成RDD2,尽量少进行算子操作,如果不能减少,则尽量合并算子,一次进行多个算子操作。3,尽量少进行shuffle,shuffle是性能杀手,还有可能引起数据倾斜等严重问题。4,大数据开发,性能第一。因为大数据的特性决定,数据量非常大,执行时间长,所以性能必须第一。...
2018-02-25 09:29:37
231
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人