MongoDB的sharding功能(转)

本文介绍了MongoDB的auto-sharding功能,通过实例演示了如何搭建MongoDB集群,包括shard节点、mongos路由进程和config服务器,并展示了如何进行数据分片。

MongoDB的auto-sharding功能是指mongodb通过mongos自动建立一个水平扩展的数据库集群系统,将数据库分表存储在sharding的各个节点上。
一个mongodb集群包括一些shards(包括一些mongod进程),mongos路由进程,一个或多个config服务器

Shards
每一个shard包括一个或多个服务和存储数据的mongod进程(mongod是MongoDB数据的核心进程)
典型的每个shard开启多个服务来提高服务的可用性。这些服务/mongod进程在shard中组成一个复制集

Chunks
Chunk是一个来自特殊集合中的一个数据范围,(collection,minKey,maxKey)描叙一个chunk,它介于minKey和maxKey范围之间。
例如chunks 的maxsize大小是100M,如果一个文件达到或超过这个范围时,会被切分到2个新的chunks中。当一个shard的数据过量时,chunks将会被迁移到其他的shards上。同样,chunks也可以迁移到其他的shards上

Config Servers
Config服务器存储着集群的metadata信息,包括每个服务器,每个shard的基本信息和chunk信息
Config服务器主要存储的是chunk信息。每一个config服务器都复制了完整的chunk信息。



配置:(模拟2个shard服务和一个config服务)
Shard1:27020
Shard2:27021
Config:27022
Mongos启动时默认使用的27017端口

新建存放数据的目录

[falcon@www.fw php.cn  ~/mongodata]$ mkdir 27020 27021 27022
[falcon@www.fwphp.cn  ~/mongodata]$ ls
27020  27021  27022

[falcon@www.fwphp.cn  ~/mongodb/bin]$ ./mongod --dbpath /home/falcon/mongodata/27020 --port 27020 > /home/falcon/mongodata/27020.log &
[falcon@www.fwphp.cn  ~/mongodb/bin]$ ./mongod --dbpath /home/falcon/mongodata/27021 --port 27021  > /home/falcon/mongodata/27021.log &
[falcon@www.fwphp.cn  ~/mongodb/bin]$ ./mongod --dbpath /home/falcon/mongodata/27022 --port 27022  > /home/falcon/mongodata/27022.log &

启动mongos时,默认开启了27017端口

[falcon@www.fwphp.cn  ~/mongodb/bin]$ ./mongos --configdb localhost:27022 > /home/falcon/mongodata/config.log &

检查是否启动

[falcon@www.fwphp.cn  ~/mongodb/bin]$ ps -ef|grep mongo
falcon    2612     1  0 20:15 ?        00:00:00 ./mongod --dbpath /home/falcon/mongodata/27020 --port 27020
falcon    2619     1  0 20:15 ?        00:00:00 ./mongod --dbpath /home/falcon/mongodata/27021 --port 27021
falcon    2625     1  0 20:15 ?        00:00:00 ./mongod --dbpath /home/falcon/mongodata/27022 --port 27022
falcon    2658     1  0 20:15 ?        00:00:00 ./mongos --configdb localhost:27022
falcon    2804  2772  0 20:31 pts/0    00:00:00 bin/mongo
falcon    2847  2812  0 20:55 pts/2    00:00:00 grep mongo
[falcon@www.fwphp.cn  ~/mongodb/bin]$

[falcon@www.fwphp.cn  ~/mongodb/bin]$ netstat -an  -t
Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address               Foreign Address             State      
tcp        0      0 0.0.0.0:10022               0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:27017               0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:587                 0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:27020               0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:27021               0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:27022               0.0.0.0:*                   LISTEN      
......   
tcp        0      0 0.0.0.0:28020               0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:28021               0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:28022               0.0.0.0:*                   LISTEN      
tcp        0      0 127.0.0.1:631               0.0.0.0:*                   LISTEN     
........

看到以上信息证明mongodb启动完整,对于开启的28020、28021、28022是对于的http接口

[falcon@www.fwphp.cn  ~/mongodb/bin]$ ./mongo   默认连接到mongos上
MongoDB shell version: 1.2.4-
url: test
connecting to: test
type "help" for help
> show dbs
admin
config
Local

加入shard节点

> use admin
switched to db admin

> db.runCommand( { addshard : "localhost:27020", allowLocal : true } )
{"ok" : 1 , "added" : "localhost:27020"}

> db.runCommand( { addshard : "localhost:27021", allowLocal : true } )
{"ok" : 1 , "added" : "localhost:27021"}

> db.runCommand({listshards:1});   查看shard节点列表
{
         "shards" : [
                 {
                         "_id" : ObjectId("4b9cd380c33000afad27718e"),
                         "host" : "localhost:27020"
                 },
                 {
                         "_id" : ObjectId("4b9cd381c33000afad27718f"),
                         "host" : "localhost:27021"
                 }
         ],
         "ok" : 1
}

新建自动切片的库user001:

> config = connect("localhost:27022")
> config = config.getSisterDB("config")
> user001=db.getSisterDB("user001");
user001
> db.runCommand({enablesharding:"user001"})
{ "ok" : 1 }

> db.printShardingStatus();
--- Sharding Status ---
   sharding version: { "_id" : ObjectId("4b9cd354c33000afad27718d"), "version" : 2 }
   shards:
       { "_id" : ObjectId("4b9cd380c33000afad27718e"), "host" : "localhost:27020" }
       { "_id" : ObjectId("4b9cd381c33000afad27718f"), "host" : "localhost:27021" }
   databases:
         { "name" : "admin", "partitioned" : false, "primary" : "localhost:27022", "_id" : ObjectId("4b9cd3776693dcfa468dec13") }
         { "name" : "user001", "partitioned" : true, "primary" : "localhost:27021", "_id" : ObjectId("4b9cde866693dcfa468dec17") }
                 my chunks

我们来在user001中新建表,插入数据

> use user001
switched to db user001
> db.createCollection("user_001")
{ "ok" : 1 }
> show collections
system.indexes
user_001
> db.user_001.insert({uid:1,username:"Falcon.C",sex:"男",age:25});
> db.user_001.find();
{ "_id" : ObjectId("4b9ce1a6c84d7f20576c4df1"), "uid" : 1, "username" : "Falcon.C", "sex" : "男", "age" : 25 }

我们来看看user001库被分配到了哪个shard上

[falcon@www.fwphp.cn  ~/mongodata]$ ls -R
.:
27020  27021  27022  mongos.log

./27020:
27020.log  mongod.lock  test.0  test.1  test.ns  _tmp

./27020/_tmp:

./27021:
27021.log  mongod.lock  _tmp  user.0  user001.0  user001.1  user001.ns  user.1  user.ns

./27021/_tmp:

./27022:
27022.log  config.0  config.ns  mongod.lock  mongos.log  _tmp

./27022/_tmp:
[falcon@www.fwphp.cn  ~/mongodata]$

从以上的文件可以看出,user001被分配到了27021的shard上了,但是通过mongos路由,我们并感觉不到是数据存放在哪个shard的chunk上


Sharding的管理命令

> db.$cmd.findOne({isdbgrid:1});                                                                          
{ "isdbgrid" : 1, "hostname" : "www.fwphp.cn", "ok" : 1 }
> db.$cmd.findOne({ismaster:1});
{ "ismaster" : 1, "msg" : "isdbgrid", "ok" : 1 }
> printShardingStatus(db.getSisterDB("config"))
--- Sharding Status ---
   sharding version: { "_id" : ObjectId("4b9cd354c33000afad27718d"), "version" : 2 }
   shards:
       { "_id" : ObjectId("4b9cd380c33000afad27718e"), "host" : "localhost:27020" }
       { "_id" : ObjectId("4b9cd381c33000afad27718f"), "host" : "localhost:27021" }
   databases:
         { "name" : "admin", "partitioned" : false, "primary" : "localhost:27022", "_id" : ObjectId("4b9cd3776693dcfa468dec13") }
                 my chunks
         { "name" : "user001", "partitioned" : true, "primary" : "localhost:27021", "_id" : ObjectId("4b9cde866693dcfa468dec17") }
                 my chunks
> use admin
switched to db admin
> db.runCommand({netstat:1})
{ "configserver" : "localhost:27022", "isdbgrid" : 1, "ok" : 1 }
>

参考信息:http://www.mongodb.org/display/DOCS/Sharding

转载于:https://www.cnblogs.com/DxSoft/archive/2010/10/21/1857363.html

### MongoDB 分片实现与最佳实践 #### 什么是分片? 分片是指将数据水平分割成较小的部分并分布到多个服务器上的过程。通过这种方式,可以显著提高系统的可扩展性和性能[^1]。 #### 如何配置分片集群? 为了设置MongoDB分片环境,通常需要三个主要组件: - **配置服务器**:存储有关整个集群元数据的信息。 - **查询路由器 (mongos)** :作为客户端应用程序访问分片数据的接口。 - **分片节点**:实际保存被切分的数据副本集实例。 创建一个简单的两成员复制集,并将其注册为新的shard之前,应该先启动至少一台`mongos`路由服务以及三台用于管理状态信息的config server。之后就可以利用admin数据库下的addShard命令来增加新加入的资源了[^3]。 ```bash # 启动 mongos 路由器 mongos --configdb <replica-set-name>/<host1>:<port>,<host2>:<port> # 添加 shard 到集群中 use admin; sh.addShard("<hostname_or_ip_of_shard_member>:<port>") ``` #### 数据库集合启用分片功能 一旦建立了基本架构,则可以通过指定特定字段作为键来进行更细粒度的操作——即开启某个collection级别的共享支持;这一步骤同样是在全局性的Admin命名空间下完成的。选择合适的shard key对于优化读写效率至关重要,因为它决定了文档如何分布在不同的物理位置上。 ```javascript // 开启 collection 的 sharding 支持 sh.enableSharding("yourDatabaseName"); // 对具体表应用 Shard Key sh.shardCollection( "yourDatabaseName.yourCollectionName", { "_id": "hashed" } // 使用哈希方式分配记录 ); ``` #### 最佳实践建议 当设计和部署基于MongoDB的应用程序时,遵循一些指导原则可以帮助确保良好的表现力和服务质量: - 尽量选取具有高基数特性的属性作为shard key候选者; - 预估未来增长趋势合理规划初始硬件资源配置; - 定期监控系统健康状况并对瓶颈做出及时响应调整; - 测试不同场景下的事务处理能力以验证稳定性[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值