在很多时候,会碰到数据量很大的问题,在处理大数据的问题上,主要有以下几种方式:
1。数据库优化,SQL优化。
2。查询条件优化。
3。临时表,历史表等。
前面这三种方式往往不能辙底的解决大数据量带来的问题(查询速度慢,造成锁表,死锁,数据回滚等),所以就出现了第四种比较间接的方式:
4。跑批。
对于要求不同的结果,设计有所不同,但跑批的形式大体相同,如查询多张表中的大量数据,就可如此设计一张表,将查询所有的信息(包含查询条件),设计成一张表,然后将每天的数据在特定的时间(非业务时间)将需要的这些数据记到该时间表中,然后查询的时候就可以只查询些一张表即可。
当然,这只是最简单的跑批,假如涉多个服务器的,多个数据库的时候,就会涉及到同步的问题;对于统计的问题,则是将每天的统计信息存于表中,当然,假如涉及明细问题,表的设计也有所不同。