NoSQL

NoSQL,指的是非关系型的数据库。NoSQL(NoSQL = Not Only SQL ),意即反SQL运动,是一项全新的数据库革命性运动,早期就有人提出,发展至2009年趋势越发高涨。

而传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,例如:
  1、High performance - 对数据库高并发读写的需求
  web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要达到每秒上万次读写请求。关系数据库应付上万次SQL查询还勉强顶得住,但是应付上万次SQL写数据请求,硬盘IO就已经无法承受了。其实对于普通的BBS网站,往往也存在对高并发写请求的需求。
  2、Huge Storage - 对海量数据的高效率存储和访问的需求
  对于大型的SNS网站,每天用户产生海量的用户动态,以国外的Friendfeed为例,一个月就达到了2.5亿条用户动态,对于关系数据库来说,在一张2.5亿条记录的表里面进行SQL查询,效率是极其低下乃至不可忍受的。再例如大型web网站的用户登录系统,例如腾讯,盛大,动辄数以亿计的帐号,关系数据库也很难应付。
  3、High Scalability && High Availability- 对数据库的高可扩展性和高可用性的需求
  在基于web的架构当中,数据库是最难进行横向扩展的,当一个应用系统的用户量和访问量与日俱增的时候,你的数据库却没有办法像web server和app server那样简单的通过添加更多的硬件和服务节点来扩展性能和负载能力。对于很多需要提供24小时不间断服务的网站来说,对数据库系统进行升级和扩展是非常痛苦的事情,往往需要停机维护和数据迁移,为什么数据库不能通过不断的添加服务器节点来实现扩展呢?
  在上面提到的“三高”需求面前,关系数据库遇到了难以克服的障碍,而对于web2.0网站来说,关系数据库的很多主要特性却往往无用武之地,例如:
  1、数据库事务一致性需求
  很多web实时系统并不要求严格的数据库事务,对读一致性的要求很低,有些场合对写一致性要求也不高。因此数据库事务管理成了数据库高负载下一个沉重的负担。
  2、数据库的写实时性和读实时性需求
  对关系数据库来说,插入一条数据之后立刻查询,是肯定可以读出来这条数据的,但是对于很多web应用来说,并不要求这么高的实时性。
  3、对复杂的SQL查询,特别是多表关联查询的需求
  任何大数据量的web系统,都非常忌讳多个大表的关联查询,以及复杂的数据分析类型的复杂SQL报表查询,特别是SNS类型的网站,从需求以及产品设计角度,就避免了这种情况的产生。往往更多的只是单表的主键查询,以及单表的简单条件分页查询,SQL的功能被极大的弱化了。
  因此,关系数据库在这些越来越多的应用场景下显得不那么合适了,为了解决这类问题的非关系数据库应运而生。
  NoSQL 是非关系型数据存储的广

义定义。它打破了长久以来关系型数据库与ACID理论大一统的局面。NoSQL 数据存储不需要固定的表结构,通常也不存在连接操作。在大数据存取上具备关系型数据库无法比拟的性能优势。该术语在 2009 年初得到了广泛认同。

它们可以处理超大量的数据。
  它们运行在便宜的PC服务器集群上。

  PC集群扩充起来非常方便并且成本很低,避免了“sharding”操作的复杂性和成本。
  它们击碎了性能瓶颈。
  NoSQL的支持者称,通过NoSQL架构可以省去将Web或Java应用和数据转换成SQL友好格式的时间,执行速度变得更快。
  “SQL并非适用于所有的程序代码,” 对于那些繁重的重复操作的数据,SQL值得花钱。但是当数据库结构非常简单时,SQL可能没有太大用处。
  没有过多的操作。
  虽然NoSQL的支持者也承认关系数据库提供了无可比拟的功能集合,而且在数据完整性上也发挥绝对稳定,他们同时也表示,企业的具体需求可能没有那么多。

  Bootstrap支持
  因为NoSQL项目都是开源的,因此它们缺乏供应商提供的正式支持。这一点它们与大多数开源项目一样,不得不从社区中寻求支持。


Membase、MongoDB、Hypertable、Apache Cassandra

03-13
### NoSQL 数据库概述 NoSQL 是指非关系型的数据库,有时也被称作 Not Only SQL 的缩写。这类数据库管理系统区别于传统的关系型数据库,主要用于处理超大规模数据的存储[^2]。 这些系统能够高效地应对像谷歌或 Facebook 每天为其用户收集的海量数据(万亿比特级别),并且具备灵活的数据模型,在不依赖固定模式的情况下支持简便的水平扩展能力。 ### NoSQL 数据库的主要优势 使用 NoSQL 数据库的原因在于其设计初衷是为了克服关系型数据库在面对大数据量和高并发访问场景下的局限性: - **灵活性**: 不需要预先定义严格的数据结构; - **可扩展性**: 更容易实现分布式部署并随着需求增长而线性扩展; - **性能优化**: 针对特定查询进行了高度优化,从而提高了读取/写入速度。 ### NoSQL 数据库分类 根据不同的架构特点和技术原理,可以将 NoSQL 数据库分为几种主要类别[^1]: #### 列族存储 (Column-family Stores) 这种类型的数据库按照列家族来组织数据,适合用来保存稀疏矩阵形式的信息集合。典型代表有 Apache Cassandra 和 HBase。 ```sql -- 创建一个简单的Cassandra表格作为例子 CREATE TABLE users ( user_id UUID PRIMARY KEY, first_name text, last_name text, email text ); ``` #### 文档数据库 (Document Databases) 文档数据库以 JSON 或 XML 形式的文档为单位进行存储,允许更复杂的嵌套结构表示对象之间的关联关系。MongoDB 就是一个流行的实例。 ```json { "_id": ObjectId("..."), "name": "John Doe", "address": { "street": "Main St.", "city": "Anytown" } } ``` #### 键值存储 (Key-value Stores) 键值对是最基本的一种无模式化数据表达方法,Redis 及 Amazon DynamoDB 属于此类。它们提供了极高的存取效率,特别适用于缓存机制或者会话状态管理等领域。 ```bash SET key value GET key ``` #### 图形数据库 (Graph Databases) 图形数据库专注于描述实体间复杂多变的关系网络,Neo4j 即为此种类型的一个范例。它非常适合社交网络分析、推荐引擎开发等方面的应用。 ```cypher // 查询与节点相连的所有其他节点 MATCH (n)-[:FRIEND]->(m) RETURN n, m; ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值