
大数据
文章平均质量分 86
橙鸭尾
这个作者很懒,什么都没留下…
展开
-
teradata体系架构简介(一)
teradata是业界知名MPP架构的数据库。简单理解MPP即这样的系统由多个物理上独立的节点通过高速网络互联组成的一个相互协同工作的大规模系统。从用户角度来看,用户的任务将会被透明的分割到多个节点。teradata架构: teradata架构由三个组件构成,从上图可以看出分别为PE、BYNET和AMP。上图只有一个PE但实际情况是由多个PE组成的。那么各个组件都负责什么工作呢? PE...转载 2018-07-26 11:21:55 · 12543 阅读 · 1 评论 -
保证分布式数据一致性的6种方案
问题的起源在电商等业务中,系统一般由多个独立的服务组成,如何解决分布式调用时候数据的一致性? 具体业务场景如下,比如一个业务操作,如果同时调用服务 A、B、C,需要满足要么同时成功;要么同时失败。A、B、C 可能是多个不同部门开发、部署在不同服务器上的远程服务。在分布式系统来说,如果不想牺牲一致性,CAP 理论告诉我们只能放弃可用性,这显然不能接受。为了便于讨论问题,先简单介绍下数据一...转载 2018-07-30 17:17:07 · 13766 阅读 · 0 评论 -
Azkaban是什么
1. Azkaban是什么?Azkaban是由Linkedin公司推出的一个批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程,它的配置是通过简单的key:value对的方式,通过配置中的dependencies 来设置依赖关系,这个依赖关系必须是无环的,否则会被视为无效的工作流。Azkaban使用job配置文件建立任务之间的依赖关系,并提供一个易于使用的web用户界...原创 2018-10-29 22:23:50 · 12078 阅读 · 0 评论