思路:
1.首先说清楚什么是缓存,2.再说Hibernate 的Session就是一级缓存,即有了一级缓存,为什么还要二级缓存,3.最后再说如何配置Hibernate的二级缓存。
1.什么是缓存?
缓存就是把以前从数据库中查询出来和使用过的对象保存在内存中(一个数据结构中),这个数据结构通常是或者类似HashMap,以后需要使用这个对象时,先查询缓存中是否有这个对象,如果有,则使用缓存中的对象,如果没有,则需要去查询数据库,并将查询出来的结果保存在缓存中,以便下次使用。
2.Hibernate的Session就是一级缓存,我们通常将之称为Hibernate的一级缓存,当想使用Session从数据库中查询出一个对象时,Session会先从自己内部查看是否存在这个对象,存在则直接返回,不存在才会去访问数据库,并将查询的结构保存在自己内部。
由于Session代表的是一次会话,一个Session与一个数据库连接相关联,所以Session最好不要长时间打开,通常仅用于一个事务当中,在事务结束后就会关闭。
并且Session是线程不安全的,被多个线程共享时容易出现问题。通常只有那种全局意义上的缓存才是真正的缓存应用,才有较大的缓存价值。
因此Hibernate的一级缓存(Session)的作用并不明显,应用价值不大。
Hibernate的二级缓存就是要为Hibernate配置一种全局缓存,让多个线程和多个事务都可以共享这个缓存,我们希望的是,一个人使用过,其他人也可以使用,Session没有这个效果。
3.二级缓存是独立于Hibernate的软件部件,属于第三方产品,多个厂商和组织都提供有缓存产品。
例如:EHCache 和 OSCache等待。
使用Hibernate二级缓存步骤:
1.首先要在Hibernate.cfg.xml配置文件中配置使用哪个厂家的缓存产品。
2.接着需要配置该缓存产品自己的配置文件,
3.最后要配置Hibernate中的哪些实体对象要纳入到二级缓存的管理中。
扩展:
一个SessionFactory可以关联一个二级缓存,即一个二级缓存只能负责缓存一个数据库中的数据,当使用Hibernate二级缓存后,注意不要有其他应用或SessionFactory来更改当前数据库中的数据,不然缓存的数据就会与数据库中的实际数据不一致。
下面是一个前辈的总结:(转)
在hibernate中最常用的有三类缓存,分别为一级缓存、二级缓存和查询缓存,
下面我们对这三个缓存在项目中的使用以及优缺点分析一下。
缓存它的作用在于提高性能系统性能,介于应用系统与数据库之间而存在于内存或磁盘上的数据。
我们编程的模式一般是这样的page-->filter-->action-->server-->dao-->db,可以在这一个请求过程中的任何一点加入缓存,上一篇介绍的是在server层加缓存:service利用aop加缓存。
为页面增加缓存:为页面加缓存
首先,来看一下一级缓存它默认开启且很常用。
一级缓存
sessin缓存、线程级缓存、事务级缓存。
我们编程中线程、事务、session这三个概念是绑定到一起的放到了threadlocal中,同时开启同时关闭即同生共死也有人叫做request-per-session-transaction编程;
当session关闭后缓存中的对象会丢失,也就是说两个不同的session中的缓存数据都是不一样的,缓存数据不能够跨session访问。
缓存数据的数据类型
在一级缓存中缓存的是实体对象,在使用查询方法get() 、load() 、iterate()三个方法查询时都会先查询session缓存,如果有对象则从缓存里面取出来,如果缓存中没有再去数据库里面查询。load()测试:测试注意一定要在同一个事务里面,当我在Spring管理的session测试时调用两次load()总是查询两次发出两条SQL语句,还以为session级缓存没有起作用,原来是因为hibernate集成spring之后事务、session都由spring管理,每次调用前后事务一级session都自动打开和关闭,自己控制不了中间过程,于是将spring去掉拿到hibernate原session,再手动开发关闭事务这样做可以保证在同一个session、同一个事务里面操作方法,确实是发了一条SQL语句,看下面代码:
load()、get()方法:
- @Test
- public void testLoad()
- {
- Session session=sf.openSession();
- session.beginTransaction();
- Category category1=(Category)session.load(Category.class,1);
- Category category2=(Category)session.load(Category.class,1);
- System.out.println(category1);
- System.out.println(category2);
- session.getTransaction().commit();
- session.close();
- }
结果
- Hibernate: select category0_.id as id0_0_, category0_.name as name0_0_ from Category category0_ where category0_.id=?
- hibernate.Category@10efd7c
- hibernate.Category@10efd7c
结果不仅发送了一条语句而且两个对象打印出来也是一样的。
load()、get()第一次查询时会发出sql语句,从数据库表里面查询;第二次查询时会先去缓存里面查找,如果没有发生更新修改操作,那么将从缓存中读取数据,否则查询数据库。
save方法
- @Test
- public void testGet()
- {
- Session session=sf.openSession();
- session.beginTransaction();
- Category category1=new Category();
- category1.setName("新闻");
- session.save(category1);
- Category category2=(Category)session.load(Category.class,category1.getId());
- System.out.println(category2.getName());
- session.getTransaction().commit();
- session.close();
- }
save也支持缓存,当执行save方法时首先往session缓存里面添加一条数据,等事务提交或者缓存刷新时才往数据库里面更新,从上面执行过程可以看出只发出了一条插入语句没有发查询语句,因为第二次是从缓存中查询出来的。
PS:save之后执行get或者load需要知道对象的ID,此时save方法执行后虽然数据库里没有数据,但是对象的ID已经生成可以通过这个ID查询对象。
批量插入数据
在批量插入数据的时候采取每次插入一部分数据,如下,每次插入20条数据不需要一条一条插入。
- public void testInserBatch() {
- Session session = sf.openSession();
- session.beginTransaction();
- for(int i=0; i<1000; i++) {
- Category c = new Category();
- c.setName("test" + i);
- session.save(c);
- if (i%20==0) {
- session.flush();
- }
- }
- session.getTransaction().commit();
- session.close();
- }
每次20条数据清理一下缓存,每次清理缓存调用session.flush()方法会发出20条insert语句,但是数据库里面还没有数据等所有数据都发出insert语句统一提交事务,事务同session是一个等级的因此需统一控制事务。
hibernate N+1问题
Hibernate 中常会用到 set 等集合表示 1 对多的关系,在我们做的这个铁科院项目中,在获取实体的时候就能根据关系将关联的对象或者对象集合取出,还可以设定 cacade 进行关联更新和删除。这不得不说 hibernate 的 orm 做得很好,很贴近 oo 的使用习惯了。
但是对数据库访问还是必须考虑性能问题的,在设定了 1 对多这种关系之后, 查询就会出现传说中的 n+1 问题。
一对多:在一方,查找得到了 n 个对象,那么又需要将 n 个对象关联的集合取出,于是本来的一条 sql 查询变成了 n+1 条;
多对一:在多方,查询得到了 m 个对象,那么也会将 m 个对象对应的 1 方的对象取出, 也变成了 m+1 ;
解决问题的方法:
1、 使用 fetch 抓取, Hibernate 抓取策略分为单端代理和集合代理的抓取策略。
Hibernate 抓取策略 ( 单端代理的抓取策略) :
保持默认也就是如下 :
<many-to-one name="clazz"cascade="save-update" fetch="select" />
fetch="select" 就是另外发送一条 select 语句抓取当前对象关联实体或者集合设置 fetch="join"
<many-to-one name="clazz"cascade="save-update" fetch="join"/>
Hibernate 会通过 select 语句使用外连接来加载器关联实体活集合此时 lazy 会失效
Hibernate 抓取策略 ( 集合代理的抓取策略 ) :
保持默认( fetch="select" )也就是如下 :
<set name="students"inverse="true">
<key column="clazz"/>
<one-to-many class="com.june.hibernate.Student"/>
</set>
1)fetch="select" 会另外发出一条语句查询集合
2) 设置fetch="join" 采用外连接集合的 lazy 失效
3) 这只fetch="subselect" 另外发出一条 select 语句抓取前面查询到的所有的实体对象的关联集合 fetch 只对 HQL 查询产生影响其他的则不会
OpenSessionInview问题
这个问题出现是由于load()懒加载导致的,第一次查询数据时使用了懒加载至查询出来数据的ID,当使用数据的时候还需要去数据库里面查询但是此时数据库的session已经关闭,解决此问题两种思路一种是不使用懒加载;其二是在web层开发关闭session,延长session的生命周期。
二级缓存
二级缓存也称为进程级缓存或sessionFactory缓存,也可以叫做集群范围内的缓存,需要第三方来实现,hibernate默认的二级缓存插件为ehcache这个缓存,由于二级缓存是进程级的可能出现多线程并发问题,需要设置缓存的并发策略。
hibernate二级缓存需要第三方插件支持,hibernate默认支持为ehcache关于配置请参考:Spring AOP +EHcache为Service层方法增加缓存
开启二级缓存后对方法的影响
get()/load()
对于这两个方法没啥影响,第一次从数据库里面查询,第二次先判断缓存里面有没有数据如果没有再去数据库里面查询。
查询缓存
查询缓存是针对普通属性结果集的缓存,不缓存实体对象,当和查询缓存关联的表发生修改的时候,查询缓存生命周期结束,里面的数据也随即被清空了。
查询缓存的配置和使用:
List方法读写查询缓存,Iterator不使用查询缓存(查询缓存只对query.list()有效)
查询缓存的配置,默认不开启hibernate3配置:
- <property name="cache.provider_class">org.hibernate.cache.NoCacheProvider</property>
- <property name="hibernate.cache.use_second_level_cache">false</property>
- <property name="hibernate.cache.use_query_cache">true</property>
代码中,加上一句话
- query.setCacheable(true)
一级、二级、查询之间的关系
开启二级缓存时,如果两个session先后执行load或者get方法,只执行一条语句第二次会从缓存中查找,先从一级缓存中查询,如果没有再去二级缓存中查找。
一级缓存同二级缓存交互
禁止一级缓存与二级缓存交互,如下设置
session.setCacheMode(CacheMode.IGNORE);打开一个session执行查询,它会先将查询结果保存到一级缓存,待session关闭后,一级缓存中数据清空,由于禁止了一级缓存同二级缓存数据交互,因此,一级缓存关闭后不会将结构保存到二级缓存,打开第二个session后,后再发送一条查询语句,因此二级缓存中没有数据。
查询缓存与二级缓存
如果两次执行query.list(),第一次发送查询语句会将结果对象的id保存到查询缓存中,第二次会先从查询缓存中取出ID,根据id先去一级缓存查找,再二级缓存,如果没有找到会去数据库中查找,一级缓存同session没有关系,只和表有关系。
开启查询,开启二级缓存
两次执行query.list(),第一次发送查询语句将结果
总结:
缓存在一个项目中对于提高系统性能很重要,除了ehcache之外还有memcache、redis等缓存产品目前都很常用,redis具有丰富的数据类型以及单线程高效能访问效率,memcache虽然是多线程但效率还是没有redis高。
这些缓存产品都可以实现分布式缓存,ehcache+rmi可以分布式缓存同步;memcache+redis都支持分布式,redis还提供了高可用性的解决方案:主从复制几个服务器直接爱你可以切换。