分区分表技术在互联网项目中的实现与应用-优快云博客

2019独角兽企业重金招聘Python工程师标准>>>

最近，正在做一个互联网项目，数据量比较大，因此，拟采用分区分表支持。

目前分区分表这种东东也比较多，在文章http://www.itokit.com/2012/0404/73496.html中有详细的介绍，写得非常好，建议对这个点比较感兴趣的同学前往观看。

文中也总结了觉的分区分表实现方式有两种：JDBC层的封装，ORM框架层的实现

Tiny框架中拟采用JDBC层的封装，采用JDBC层的封装有诸多好处，第一，对应用的影响最小，第二，对各种数据库有更好的更通用的支持；当然，同步带来的问题就是难度比较大。

目前拟提供特性如下：

支持同库分表：即把表aaa，分为aaa0,aaa1,aaa2,aaa3...的方式
支持异库分表：即把表aaa分解到db0,db1,db2,db3多个Schema中的方式
支持读写分离方式：即一写多读的支持
支持读写分离备方式：即一写，若干写备，多读的方式。如果写库当机，备机可以顶上

删除语句示例代码如下：

Class.forName("org.tinygroup.dbcluster.jdbc.TinyDriver");
        Connection conn = DriverManager.getConnection("jdbc:dbcluster://cluster1", "sa", "123456");
        Statement stmt = conn.createStatement();
        String sql = "delete from aaa";
        stmt.execute(sql);

日志输出

Using shard:shard0 to execute sql:delete from aaa
Using shard:shard1 to execute sql:delete from aaa
Using shard:shard2 to execute sql:delete from aaa

插入语句示例：

Class.forName("org.tinygroup.dbcluster.jdbc.TinyDriver");
        Connection conn = DriverManager.getConnection("jdbc:dbcluster://cluster1", "sa", "123456");
        Statement stmt = conn.createStatement();
        String sql;
        //插入100条数据
        for (int i = 0; i < 100; i++) {
            sql = "insert into aaa(id,aaa) values (" + clusterManager.getPrimaryKey(cluster, "aaa") + ",'ppp')";
            boolean result = stmt.execute(sql);
        }

控制台信息：

Using shard:shard0 to execute sql:insert into aaa(id,aaa) values (0,'ppp')
Using shard:shard1 to execute sql:insert into aaa(id,aaa) values (1,'ppp')
Using shard:shard2 to execute sql:insert into aaa(id,aaa) values (2,'ppp')
Using shard:shard0 to execute sql:insert into aaa(id,aaa) values (3,'ppp')
Using shard:shard1 to execute sql:insert into aaa(id,aaa) values (4,'ppp')
Using shard:shard2 to execute sql:insert into aaa(id,aaa) values (5,'ppp')
Using shard:shard0 to execute sql:insert into aaa(id,aaa) values (6,'ppp')
Using shard:shard1 to execute sql:insert into aaa(id,aaa) values (7,'ppp')
Using shard:shard2 to execute sql:insert into aaa(id,aaa) values (8,'ppp')
Using shard:shard0 to execute sql:insert into aaa(id,aaa) values (9,'ppp')
Using shard:shard1 to execute sql:insert into aaa(id,aaa) values (10,'ppp')
Using shard:shard2 to execute sql:insert into aaa(id,aaa) values (11,'ppp')
Using shard:shard0 to execute sql:insert into aaa(id,aaa) values (12,'ppp')
Using shard:shard1 to execute sql:insert into aaa(id,aaa) values (13,'ppp')
Using shard:shard2 to execute sql:insert into aaa(id,aaa) values (14,'ppp')
Using shard:shard0 to execute sql:insert into aaa(id,aaa) values (15,'ppp')
......

比上面的示例看出，对于最终用户来说，除了url有些不一样之外，其它是与普通的JDBC使用完全一致的。所以，不会像某些框架，只支持少数几种数据库类型的情况出现。只要是遵从JDBC规范的数据库，全部可以支持。

当然，说到到分片处理，唯一主键的处理就非常关键。

为了方便使用，主键的处理，是在JDBC层进行处理的，也就是说，只要像常见的方式设置主键自动生成，应用层不用做任何特殊处理，底层就会自动为期提供主键，且保证不同的分片之间的主键不会重复。

对于SQL的支持来说，除了两个分片之间不能做关联之外，其它与常见处理没有任何区别。

当然，为了方便使用，对于统计方面的支持也是非常好的。

比如：执行的sql语句是select count(*) from aaa，底层会自动进行结果搜索并返回合并后的结果。

比如：执行的SQL语句是select avg(score) from student，底层也会进行处理，并返回合并后的结果，能够做到结果与未库完全一致。

对于读写分离来说，处理就简单多了，这里不再细述。

进度情况：目前已经实现相关部分功能，期待在2013年结束之前能够放出来。

框架的扩展性非常好，完全可以自定义各种分区，分表，路由规则的实现，当然在一般情况下，框架自带的也已经足够。

相关内容在实现到一定程度再行补充。

转载于:https://my.oschina.net/tinyframework/blog/185134