mysql支持join操作,可以将两张或者多张表进行join关联在一起后进行查询操作。为了避免大表的join性能问题,有些场景我们不希望进行join查询,那我们可以怎么办呢?
我们可以通过代码模拟join操作,比如我们有两张表,domain_entity, domain_attribute
CREATE TABLE `domain_entity` (
`id` BIGINT(20) NOT NULL AUTO_INCREMENT,
`domain_content` VARCHAR(1024) NOT NULL,
`domain_id` BIGINT(20) NOT NULL,
`domain_value` BIGINT(20) NOT NULL,
PRIMARY KEY (`id`),
INDEX `domain_id` (`domain_id`)
)
COMMENT='domain_entity'
COLLATE='gbk_chinese_ci'
ENGINE=InnoDB
;
CREATE TABLE `domain_attribute` (
`id` BIGINT(20) NOT NULL AUTO_INCREMENT,
`domain_key` BIGINT(20) NULL DEFAULT NULL,
`domain_val` BIGINT(20) NULL DEFAULT NULL,
`domain_id` BIGINT(20) NULL DEFAULT NULL,
PRIMARY KEY (`id`),
INDEX `domain_id` (`domain_id`)
)
COMMENT='domain_attribute'
COLLATE='gbk_chinese_ci'
ENGINE=InnoDB;
两张表通过domain_id进行关联,普通的join操作十分简单:
select * from domain_entity A join domain_attribute B on A.domain_id=B.domain_id where B.domain_key='k' and B.domain_val ='v' and A.domain_content like '%content%' order by domain_value limit 0,10
那如果不通过join,通过代码模拟join怎么操作?join操作是将两张表通过外键domain_id进行关联后再通过属性进行过滤,所以我们可以两张表分为两类:
一类是过滤表A
一类是排序分页表B
先通过属性在过滤表A中过滤一遍,得到外键domain_id,然后再将满足条件的domain_id作为条件去B表进行查询并且排序分页。如:
1. select domain_id from domain_attribute A where A.domain_key='k' and A.domain_val='v'
获取到了domain_id后,将domain_id传入domain_entity进行查询
2. select domain_id from domain_entity where domain_id in (set from step 1) and domain_content like '%content%' order by domain_value limit 0,10
这两个步骤其实就是模拟了join操作,从一张表中获取全量id,然后去另一张进行关联后在进行过滤并且进行分页排序。
这个方法有个限制就是必须按照B表进行排序和分页,如果想通过A表进行分页排序就不行了,当然想通过A,B表复合排序那是肯定不行的。
一般选取A表和B表的方法是尽量选择数据量小的作为A表,这样A表过滤后得到的集合较小,然后在传入B表进行过滤的成本就小很多。当然也要结合业务逻辑来进行调整,比如排序和分页的要求。