- 博客(18)
- 收藏
- 关注
转载 MR执行流程详解
1 MR 切片机制 & MR全流程https://blog.youkuaiyun.com/javastart/article/details/529031242 MR执行流程详解https://blog.youkuaiyun.com/Milkcoffeezhu/article/details/805515863 MR 切片逻辑https://blog.youkuaiyun.com/qq_38250124/...
2018-10-22 10:56:13
2652
原创 mysql having和where的区别
语法上的区别是, having一般跟在group by之后, 对分组数据进行过滤.原文: http://blog.sina.com.cn/s/blog_9c6852670102wx87.html
2018-10-19 17:16:56
180
转载 Sql语句执行顺序 经典
MySQL的语句一共分为11步,如下图所标注的那样,最先执行的总是FROM操作,最后执行的是LIMIT操作。其中每一个操作都会产生一张虚拟的表,这个虚拟的表作为一个处理的输入,只是这些虚拟的表对用户来说是透明的,但是只有最后一个虚拟的表才会被作为结果返回。如果没有在语句中指定某一个子句,那么将会跳过相应的步骤。 1 下面我们来具体分析一下查询处理的每一个阶段 2 FORM: 对F...
2018-10-19 09:42:54
174
转载 scala协变和逆变 对比Java泛型
https://blog.youkuaiyun.com/pzw_0612/article/details/47377531
2018-08-27 09:52:39
248
转载 scala类型系统之: 类型变量界定、视图界定、上下文界定
类型变量界定(Type Variable Bound)、视图界定(View Bound)、上下文界定(Context Bound),在scala中算很重要的内容了,这次博客就来写点自己的理解。 1、类型变量界定(Type Variable Bound):// 编译错误 def typeVariable[T](a: T, b: T) = { if (a.compare...
2018-08-26 13:41:09
540
转载 Jode-Time学习笔记
一 Jode-Time 介绍任何企业应用程序都需要处理时间问题。应用程序需要知道当前的时间点和下一个时间点,有时它们还必须计算这两个时间点之间的路径。使用 JDK 完成这项任务将非常痛苦和繁琐。既然无法摆脱时间,为何不设法简化时间处理?现在来看看 Joda Time,一个面向 Java™ 平台的易于使用的开源时间/日期库。正如您在本文中了解的那样,JodaTime轻松化解了处理日期和时间...
2018-08-24 14:06:19
894
转载 spark core组件:RDD、DataFrame和DataSet介绍、场景与比较
http://www.aboutyun.com/thread-20902-1-1.html
2018-08-21 11:33:53
268
转载 在Linux下判断系统当前是否开启了超线程
在判断当前是否开启了超线程之前,需要先判断另外几个数据:1,物理CPU个数: 1 2 3 [root@localhost ~]# cat /proc/cpuinfo | grep "physical id" | sort | uniq physical id : 0 physical id : 1 可以看到物理CPU个数...
2018-08-01 14:30:50
175
转载 utf8_general_ci、utf8_unicode_ci和utf8_bin的区别
2015年11月14日 12:09:30阅读数:11442utf8_general_ci 不区分大小写,这个你在注册用户名和邮箱的时候就要使用。utf8_general_cs 区分大小写,如果用户名和邮箱用这个就会照成不良后果。utf8_bin: compare strings by the binary value of each character in the stri...
2018-07-30 15:35:04
148
转载 【nginx】配置Nginx实现负载均衡
在关于高并发负载均衡一文中已经提到,企业在解决高并发问题时,一般有两个方向的处理策略,软件、硬件,硬件上添加负载均衡器分发大量请求,软件上可在高并发瓶颈处:数据库+web服务器两处添加解决方案,其中web服务器前面一层最常用的的添加负载方案就是使用nginx实现负载均衡。 一、负载均衡的作用1、转发功能按照一定的算法【权重、轮询】,将客户端请求转发到不同应用服务器上,减轻单个服务...
2018-07-30 11:42:12
182
转载 Jmeter中的几个重要测试指标释义
我是做开发的, 但是免不了需要对接口进行性能测试, 由于我的接口涉及到加解密和签名验签, 所以使用 Beanshell Sample 直接调用我的用接口调用代码打成的Java jar包.Aggregate Report 是 JMeter 常用的一个 Listener,中文被翻译为“聚合报告”。今天再次有同行问到这个报告中的各项数据表示什么意思,顺便在这里公布一下,以备大家查阅。如果大家...
2018-07-18 15:04:46
1096
转载 哈希为什么查询速度 快
哈希算法存取之所以快,是因为其 直接通过关键字key得到要存取的记录内存存储位置试想这样的场景,你很想学太极拳,听说学校有个叫张三丰的人打得特别好,于是你到学校学生处找人,学生处的工作人员可能会拿出学生名单,一个一个的查找,最终告诉你,学校没这个人,并说张三丰几百年前就已经在武当山作古了。可如果你找对了人,比如在操场上找那些爱运动的同学,人家会告诉你,"哦,你找张三丰呀,有有有,我带你去。...
2018-07-17 13:44:25
1722
转载 为什么hash作为内存使用的经典数据结构?
听到这样说法:hash是内存中使用的经典数据结构。内存是典型的随机访问设备。 为什么hash这种数据结构很适合内存使用呢?如何理解内存是随机访问设备呢? 因为我想知其所以然,如何理解背后的原因,我花费点时间来学习一番。 我之前学过搜索引擎中的倒排索引,其中的单词词典就是使用hash方式实现:对关键词做hash值,同样hash值的关键词都归到一起。这是我通俗化接触has...
2018-07-17 13:13:12
855
原创 Java实现一个简单的队列---Queue
对于队列的应用的很多,但是我觉得理解队列最重要的是要记住,先进先出,一端插入,一端删除。 (1)队列的定义:队列是一种特殊的线性表,特殊之处在于它只允许在表的前端(front)进行删除操作,而在表的后端(rear)进行插入操作,进行插入操作的端称为队尾, 进行删除操作 的端称为队头。理解好定义,那么我们就通过代码再来分析一下:public class Queue<E> { ...
2018-07-13 18:03:34
338
转载 VMware虚拟机文件后缀详解【zz】
虚拟机的文件管理由VMware Workstation来执行,一个虚拟机一般以一系列文件的形式储存在宿主机中,这些文件一般在由workstation为虚拟机所创建的那个目录中。这里列出了这些关键文件的扩展名。在这些例子中,<vmname>表示你的虚拟机名字。.log <vm name>.log or vmware.log这个文件记录了VMware Workstation对虚...
2018-07-01 00:53:07
2452
原创 重装系统和vmware之后, 之前的虚拟系统无法使用
重装完系统和vmware之后, 1) 使用之前的vmx文件直接打开, 但是进入不了系统;2) 接着打开虚拟机设置, 添加本地磁盘文件vmdk,但是提示3) 继续百度和搜索
2018-06-30 21:44:31
7384
转载 Hadoop NameNode元数据相关文件目录解析
本文转自 Hadoop NameNode元数据相关文件目录解析一 NameNode 元数据相关文件目录架构二 元数据相关文件解析1 VERSION 文件2 seen_txid 文件3 fsimage 和 edits 及 md5 校验文件三 文件系统元数据 fsimage 和编辑日志 edits1 edits 和 fsimage 文件的概念2 fsimage 和 edits 的工作原理其他信息备用 ...
2018-04-09 13:42:52
762
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人