Query Cache,查询缓存,是mysql内部的一种缓存机制,用来缓存查询语句的完整结果集。
工作原理:
开启了查询缓存之后,mysql接到select语句的时候,会先到query cache中去查询有没有这个select语句的缓存,如果有,直接将结果返回客户端,省去语句的解析、优化和执行步骤;如果没有结果,则对语句解析、优化、执行,返回结果给客户端的同时,将结果集写入缓存。
缓存的键就是客户端传过来的select查询语句,mysql没有做任何处理,只要字符大小写,空格等稍有不同,mysql就认为这是不同的查询;缓存结果集的时候,会把这个查询相关的数据表也记下来,只要相关数据表的数据发生变化,这个缓存即宣告失效,而很可能缓存的这部分结果集的数据并没有发生变化;这时同样的查询语句过来,也查不到有效的缓存,必须去执行语句来获得结果。由此可见,mysql对查询缓存的管理比较粗放,显得不够精细,但简单的好处就是开销较小,这对繁忙的数据库是很重要的。
相关配置:
在mysql配置文件中,和query cache相关的选项主要有:
query_cache_type,缓存的开关,值有off、on、demand,demand表示只有在select语句中显示的指定了SQL_CACHE,服务器才会缓存其查询结果;
query_cache_size,分配给缓存的大小,单位字节,必须是1024的整数倍,这是一个全局级的缓存,为所有的连接所共用,不是线程级的;
query_cache_min_res_unit 服务器给具体select语句分配缓存块的最小值;
query_cache_limit 缓存块的最大值。
利弊权衡:
开启query cache,就有相应的开销:服务器接到每个select语句,都会先检查有没有缓存,如果没有,在通过执行获得结果集的时候,还要写缓存;当执行写操作使相关数据表数据改变之后,还得把相应缓存失效,这些都是开销,所以就要衡量开销和收益,以决定是否值得使用query cache。
通过show status命令可以获得query cache相关运行参数,从而计算出cache命中率,公式如下:
命中率 = Qcache_hits / Com_select(不同的mysql版本,可能变量名不一样)
缓存未命中的原因主要有以下几条:
含有不确定函数的查询语句不能缓存;
缓存失效(相关表的数据发生变化或者因为内存不足被替换出去);
当然命中率高低也不能绝对说明问题,假设缓存命中率只有30%,但是缓存的都是执行起来极其耗资源的select语句,那可能付出的开销还是值得的。
在innode引擎中,由于事务的支持,使得query cache更容易失效,更需要仔细分析权衡。
综上,在具体的环境中,使用query cache是否能带来性能的提升,要根据应用业务等具体情况具体分析,此外可以借助其它工具来实现和query cache同级的数据缓存,比如业内广泛采用的memcache等。