Airbnb | 数据基础设施

背景

阅读Data Infrastructure at Airbnb
airbnb是一家主要做租房业务的公司,上面文章是2016年对内部数据基础设施的总结。
airbnb做基础设施的哲学就是以数据为中心,从公司业务角度,核心就是对数据的分析挖掘和管理。

airbnb基础设施有几点哲学

  1. 拥抱开源,组件标准化;尽量不要自己造轮子,借助开源社区已有的方案,快速向前
  2. 考虑系统的可扩展性,以及机器资源的提前考量
  3. 以业务需求为出发点

airbnb数据基础设施

核心设计就是为了提高容灾等级,分离了计算和存储集群,Gold和Silver集群;数据从G到S进行单向拷贝;G集群是S集群数据的真子集。

这里面的技术关键点在于,G集群数据的增加和修改,都需要及时同步给S集群。开源社区并没有副本优化问题(replication optimization problem),airbnb自己实现了一套工具完成这个事情。

最后说了一下针对hadoop集群做的优化;

主要的解决方法就是转向一些标准技术栈来解决的;

有一个问题是EBS远端读写性能差的问题,放弃了HDFS本身的多副本策略,然后通过转向本地存储,只运行一个可用实例来解决的。

这个解决方法,有点像之前工作中遇到的ceph副本造成内网的网络带宽过满的问题。然后我们使用单一副本来解决的。

总结

适合自己业务的才是最好的方案,有时需要懂得取舍。不一定非要用高大上的技术来做基础设施,还是稳定为主。

备注:
Apache Sqoop™ is a tool designed for efficiently transferring bulk data between Apache Hadoop and structured datastores such as relational databases.

美国著名共享民宿网站 Airbnb 开放的民宿信息和住客评价数据,包括民宿的位置、房间、配置、价格、住客的评分和自然语言评论等。目前Airbnb开放数据的城市如下表所示。 城市名称 省份和地区 所在国家 Amsterdam North Holland The Netherlands Antwerp Flemish Region Belgium Asheville North Carolina United States Athens Attica Greece Austin Texas United States Barcelona Catalonia Spain Berlin Berlin Germany Boston Massachusetts United States Brussels Brussels Belgium Chicago Illinois United States Copenhagen Hovedstaden Denmark Denver Colorado United States Dublin Leinster Ireland Edinburgh Scotland United Kingdom Geneva Geneva Switzerland Hong Kong Hong Kong China London England United Kingdom Los Angeles California United States Madrid Comunidad de Madrid Spain Mallorca Islas Baleares Spain Manchester England United Kingdom Melbourne Victoria Australia Montreal Quebec Canada Nashville Tennessee United States New Orleans Louisiana United States New York City New York United States Northern Rivers New South Wales Australia Oakland California United States Paris France France Portland Oregon United States Quebec City Quebec Canada San Diego California United States San Francisco California United States Santa Cruz County California United States Seattle Washington United States Sydney New South Wales Australia Toronto Ontario Canada Trentino Trentino-Alto Adige_Südtirol Italy Vancouver British Columbia Canada Venice Veneto Italy Victoria British Columbia Canada Vienna Vienna Austria Washington D.C.District of Columbia United States
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值