
大数据
zhuge134
这个作者很懒,什么都没留下…
展开
-
windows记事本特别注意
千万不要使用Windows自带的记事本编辑任何文本文件。原因是Microsoft开发记事本的团队使用了一个非常弱智的行为来保存UTF-8编码的文件,他们自作聪明地在每个文件开头添加了0xefbbbf(十六进制)的字符,你会遇到很多不可思议的问题,比如,网页第一行可能会显示一个“?”,明明正确的程序一编译就报语法错误,等等,都是由记事本的弱智行为带来的。建议你下载Notepad++代替记事本,不但功转载 2018-01-06 16:02:48 · 2381 阅读 · 0 评论 -
json4s反序列化时对于可选值的处理
将字符串反序列化为java对象,如果对象中的某些属性在字符串中不存在对应的键值对,一般该属性就是默认值,当然也要看不同的json序列化框架,在使用java的json序列化框架时我们很容易处理这些情况。在使用scala时如果想进行json序列化和反序列化,有时并不是那么方便,尤其是在字符串和scala对象之间进行互转,json4s就是一个使用scala写的json序列化框架,可以很好第解决字...原创 2019-01-07 22:41:57 · 538 阅读 · 0 评论 -
spark保存的parquet文件在hive中读取报错
报错如下:can not find value at 0 in block ...................这个错误是由于hive中使用的parquet约定与spark中不同导致的,在hive中,decimal类型是固定用int32来表示,而标准的parquet规范约定:1=<精度<=9,使用int32表示;1=<精度<=18,使用int64表示,spar...原创 2019-01-07 23:02:21 · 3605 阅读 · 0 评论 -
记录一次定位spark shuffle总是报connection reset by peer的问题
问题描述:spark使用dynamicAllocation模式,开启external shuffle service,并且yarn上也正常起了spark-shuffle service ,在shuffle过程中,executor总是报connection reset by peer异常,导致拉取shuffle数据失败,任务失败。尝试了以下措施:1. spark.shuffle.blockT...原创 2019-01-19 20:34:03 · 5609 阅读 · 0 评论 -
红黑树插入分析,java实现
不想打字,直接贴手写的稿纸吧^_^代码地址:https://github.com/zhuge134/data-structures-and-algorithm-learn/blob/master/src/main/java/com/zhuge/learn/dsaa/datastructure/tree/RedBlackTree.java实现不是很好,有待改进...原创 2019-03-02 21:31:48 · 172 阅读 · 0 评论 -
ArrayList.removeIf 方法源码阅读
先贴上代码:public boolean removeIf(Predicate<? super E> filter) { Objects.requireNonNull(filter); // figure out which elements are to be removed // any exception thrown from the filter...原创 2019-03-03 00:25:59 · 567 阅读 · 0 评论 -
LinkedList源码阅读
拣几个重要的方法说一下:1. 首先是:addAll(int index, Collection<? extends E> c)方法,将给定集合中的所有元素添加到制定的下标处/** * Inserts all of the elements in the specified collection into this * list, starting at the speci...原创 2019-03-03 12:55:06 · 360 阅读 · 0 评论 -
单例模式
单利模式的一种典型实现方式,双重检验锁。需要说明的是instance必须是volatile修饰的,因为instance = new SingleInstance()这句话在jvm中的执行步骤如下:1. 在堆内存中分配一个新的SingleInstance实例内存空间2. 执行SingleInstance构造函数3. 将新的实例的引用赋值给instance由于jvm会进行指令重排的优化,...原创 2019-03-08 19:42:07 · 144 阅读 · 0 评论 -
ThreadPoolExecutor构造函数各参数意义
ThreadPoolExecutor类是java的线程池实现的核心类,ThreadPoolExecutor类有四个构造方法,其中三个构造方法最终都是调用另一个参数最全的构造方法,这里整理一下各参数的意义及使用时的注意点,同时也能加强记忆。首先贴上jdk源码中的javadoc:/** * Creates a new {@code ThreadPoolExecutor} with the ...原创 2019-03-10 12:48:31 · 1901 阅读 · 0 评论 -
java AQS源码阅读
####addWaiter该方法用于向等待队列中添加一个节点,对于获取独占锁的方法(acquire)传入的mode是EXCLUSIVE,获取共享锁的传入的是SHAREDprivate Node addWaiter(Node mode) { Node node = new Node(Thread.currentThread(), mode); // Try the fast pa...原创 2019-04-22 00:04:04 · 323 阅读 · 0 评论 -
从 1 到 n 整数中 1 出现的次数
leetCode和剑指offer上都有此题,普通的遍历思路就不说了,时间复杂度是O(nlogn)主要分析一下如下的解题思路:public int NumberOf1Between1AndN_Solution(int n) { int cnt = 0; for (int m = 1; m <= n; m *= 10) { int a = n / m...原创 2019-04-14 20:43:44 · 248 阅读 · 0 评论 -
矩阵最大路径问题
题目:在一个 m*n 的棋盘的每一个格都放有一个礼物,每个礼物都有一定价值(大于 0)。从左上角开始拿礼物,每次向右或向下移动一格,直到右下角结束。给定一个棋盘,求拿到礼物的最大价值。例如,对于如下棋盘1 10 3 812 2 9 65 7 4 113 7 16 5礼物的最大价值为 1+12+5+7+7+16+...原创 2019-04-15 01:16:56 · 3685 阅读 · 0 评论 -
纯洁的微笑个人博客,mark一下,向大神学习^_^
http://www.ityouknow.com/原创 2019-01-12 23:01:56 · 733 阅读 · 0 评论 -
在notepad里用正则表达式高效替换
假设要将下面这段内容按规则转换:{[/actuator/env],methods=[POST],consumes=[application/vnd.s{[/actuator/env],methods=[DELETE],produces=[application/vnd{[/actuator/info],methods=[GET],produces=[application/vnd.s{[...原创 2019-01-12 22:06:49 · 1067 阅读 · 0 评论 -
spring cloud Finchley版本 刷新配置refresh
spring boot版本2.0.0spring cloud版本finchley1. 起一个config server, 略2. 创建一个config-client模块, bootstrap.yml简单配置如下:spring: application: name: config-client cloud: config: enabled:...原创 2019-01-12 21:58:39 · 353 阅读 · 0 评论 -
HBase主要API总结及代码示例
一、几个主要 Hbase API 类和数据模型之间的对应关系:1、 HBaseAdmin关系: org.apache.hadoop.hbase.client.HBaseAdmin作用:提供了一个接口来管理 HBase 数据库的表信息。它提供的方法包括:创建表,删 除表,列出表项,使表有效或无效,以及添加或删除表列族成员等。2、 HBaseConfiguration关系: org.apache.ha...转载 2018-03-12 00:02:09 · 6424 阅读 · 0 评论 -
spark thriftserver 的一些问题
更新记录初始发布:2017-09-19第一次更新:xxx简介Thrift JDBC/ODBC Server (简称 Spark Thrift Server 或者 STS)是Spark SQL的Apache Hive HiveServer2的端口,通过这个端口可以允许用户使用JDBC/ODBC端口协议来执行SQL查询。通过使用STS,商业用户就可以用使用一些炫目的BI工具,比如Tableau来连接S...转载 2018-03-05 23:54:33 · 4580 阅读 · 0 评论 -
在yarn fairScheduler中使用node-label特性
连接地址:http://doc.mapr.com/display/MapR/Label-based+Scheduling+for+YARN+Applications#Label-basedSchedulingforYARNApplications-CreatingQueueLabelsLabel-based Scheduling for YARN ApplicationsSkip to end o...转载 2018-03-13 23:45:58 · 1623 阅读 · 1 评论 -
java中出现超出预期的异常可以捕获throwable来定位
一般在写java代码时习惯捕获Exception, 实际上java中异常的顶级父类是throwable, 经常会出现一些并非exception继承分支中的异常,比如scala中有大量的异常都不是继承自exception, 又如classnotdefexception , abstractmethoderror等继承自Error的一些异常。异常情况超出我们的预期,导致程序逻辑直接中断,很多时候我们会...原创 2018-11-23 07:29:34 · 1247 阅读 · 0 评论 -
Spring Boot 中文索引
包括一些springboot教程,以及一些开源项目http://springboot.fun/转载 2018-12-16 12:42:11 · 720 阅读 · 0 评论 -
yaml语法注意点——空格
spring boot默认使用yml文件作为配置文件,yml语法因为其简介并且表现力强而得到诸多项目的使用,但是初学yml语法还是会趟一些坑,比如空格的使用;idea中对yml也是支持的,对于一个正常的配置项会显示为蓝色如果将name和baba之间的空格去掉,就不会显示蓝色这种情况下应用在启动的时候就会报 java.lang.IllegalStateException: ...原创 2018-12-16 19:57:04 · 11602 阅读 · 0 评论 -
idea通过git将项目上传到github
一、 创建github仓库参考:http://www.jianshu.com/p/be9f0484af9d 1. 打开github官网:https://link.jianshu.com/?t=https://github.com/ 2. 填写信息,点击sigh up for github 3. 按照个人需要填写仓库名、仓库描述等,建议勾选“Initialize this repository ...转载 2018-12-28 21:15:25 · 1295 阅读 · 0 评论 -
spring boot中使用jackson出现java.lang.NoClassDefFoundError: Could not initialize class com.fasterxml.jack
Jackson Dependency Issue in Spring Boot with Maven BuildIn this article, a Spring Boot 1.3.3 dependency issue is explored and an override is provided. by John Thompson · May. 23, 16 · Java ...转载 2018-12-31 16:28:01 · 7540 阅读 · 0 评论 -
spring 定时任务执行两次的问题
@SpringBootApplication@EnableScheduling@EnableConfigurationProperties({TimerTask.class})public class ScheduleTaskApp { public static void main(String[] args) { SpringApplication.run(Sc...转载 2019-01-01 14:04:36 · 579 阅读 · 0 评论 -
关于dubbo和spring cloud比较的文章,总结得非常好
转载自:https://mp.weixin.qq.com/s/aYlHAXNbwiXq7DPFOYTK6A? 阿里Dubbo疯狂更新,关Spring Cloud什么事?纯洁的微笑 纯洁的微笑 2017-11-20最近,开源社区发生了一件大事,那个全国 Java 开发者使用最广的开源服务框架 Dubbo 低调重启维护,并且 3 个月连续发布了 4 个维护版本。 我上次在写“放...转载 2019-01-06 21:51:19 · 420 阅读 · 0 评论 -
【转】一文读懂HDFS
在腾讯云社区上看到的一片文章,对于hdfs的整体介绍,比较全面,对应的hdfs版本比较新,2.x以上。这里转载一下,以后可以随时复习一下。原文链接:https://cloud.tencent.com/developer/article/1031641依稀为正文部分:独家 | 一文读懂Hadoop(二)HDFS(上)数据派THU发表于数据派THU订阅502随...转载 2019-05-12 12:55:53 · 721 阅读 · 0 评论