BigTable

最新推荐文章于 2024-06-20 12:54:36 发布

XUENIAO

最新推荐文章于 2024-06-20 12:54:36 发布

阅读量662

点赞数

分类专栏：数据库文章标签：数据库 google mapreduce schema 存储扩展

数据库专栏收录该内容

4 篇文章

订阅专栏

BigTable是谷歌的一款非关系型数据库，采用分布式、持久化的多维排序Map结构存储数据，旨在处理PB级数据。它具备广泛的适用性、良好的扩展性、高性能及高可用性等特点，已在Google的多个核心产品中得到广泛应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

BigTable

简介

　　BigTable是非关系的数据库,是一个稀疏的、分布式的、持久化存储的多维度排序Map。Bigtable的设计目的是可靠的处理PB级别的数据，并且能够部署到上千台机器上。Bigtable已经实现了下面的几个目标：适用性广泛、可扩展、高性能和高可用性。Bigtable已经在超过60个Google的产品和项目上得到了应用，包括 Google Analytics、GoogleFinance、Orkut、Personalized Search、Writely和GoogleEarth。这些产品对Bigtable提出了迥异的需求，有的需要高吞吐量的批处理，有的则需要及时响应，快速返回数据给最终用户。它们使用的Bigtable集群的配置也有很大的差异，有的集群只有几台服务器，而有的则需要上千台服务器、存储几百TB的数据。

功能

　　在很多方面，Bigtable和数据库很类似：它使用了很多数据库的实现策略。并行数据库【14】和内存数据库【13】已经具备可扩展性和高性能，但是Bigtable提供了一个和这些系统完全不同的接口。Bigtable不支持完整的关系数据模型；与之相反，Bigtable为客户提供了简单的数据模型，利用这个模型，客户可以动态控制数据的分布和格式（alex注：也就是对BigTable而言，数据是没有格式的，用数据库领域的术语说，就是数据没有Schema，用户自己去定义Schema），用户也可以自己推测(alex注：reasonabout)底层存储数据的位置相关性(alex注：位置相关性可以这样理解，比如树状结构，具有相同前缀的数据的存放位置接近。在读取的时候，可以把这些数据一次读取出来)。数据的下标是行和列的名字，名字可以是任意的字符串。Bigtable将存储的数据都视为字符串，但是Bigtable本身不去解析这些字符串，客户程序通常会在把各种结构化或者半结构化的数据串行化到这些字符串里。通过仔细选择数据的模式，客户可以控制数据的位置相关性。最后，可以通过BigTable的模式参数来控制数据是存放在内存中、还是硬盘上。

　　特点:

　　1、适合大规模海量数据，PB级数据；

　　2、分布式、并发数据处理，效率极高；

　　3、易于扩展，支持动态伸缩；

　　4、适用于廉价设备；

　　5、适合于读操作，不适合写操作。

　　6、不适用于传统关系数据库；

　　应用:

　　BigTable为谷歌旗下的搜索、地图、财经、打印、以及社交网站Orkut、视频共享网站YouTube和博客网站Blogger等业务提供技术支持。

　　2010年9月，Google宣布将放弃MapReduce 新索引系统将迁移至BigTable平台。新平台基于Colossus，也被称为GFS2。