实际开发中的一些问题:
批量的修改数据库字段(大数据量),
因为hibernate中提供了批量处理 的解决方案
Hibernate批量处理其实从性能上考虑,它是很不可取的,浪费了很大的内存。从它的机制上讲,Hibernate它是先把符合条件的数据查出来,放到内存当中,然后再进行操作。实际使用下来性能非常不理想,在笔者的实际使用中采用下面的第三种优化方案的数据是:100000条数据插入数据库,主流台式机的配置,需要约30分钟,呵呵,晕倒。
总结下来有三种来处理以解决性能问题:
1:绕过Hibernate API ,直接通过 JDBC API 来做,这个方法性能上是比较好的。也是最快的。
2:运用存储过程。
3:还是用Hibernate API 来进行常规的批量处理,可以也有变,变就变在,我们可以在查找出一定的量的时候,及时的将这些数据做完操作就
删掉,session.flush();session.evict(XX对象集); 这样也可以挽救一点性能损失。这个“一定的量”要就要根据实际情况做定量参考了。一般为30-60左右,但效果仍然不理想。
1:绕过Hibernate API ,直接通过 JDBC API 来做,这个方法性能上是比较好的,也是最快的。(实例为 更新操作)
Transaction tx=session.beginTransaction(); //注意用的是hibernate事务处理边界
Connection conn=session.connection();
PreparedStatement stmt=conn.preparedStatement("update CUSTOMER as C set C.sarlary=c.sarlary+1 where c.sarlary>1000");
stmt.excuteUpdate();
tx.commit(); //注意用的是hibernate事务处理边界
这小程序中,采用的是直接调用JDBC 的API 来访问数据库,效率很高。避免了Hibernate 先查询出来加载到内存,再进行操作引发的性能问题
2:运用存储过程。但这种方式考虑到易植和程序部署的方便性,不建议使用.(实例为 更新操作)如果底层数据库(如Oracle)支持存储过程,也可以通过存储过程来执行批量更新。存储过程直接在数据库中运行,速度更加快。在Oracle数
据库中可以定义一个名为batchUpdateCustomer()的存储过程,代码如下:
代码内容
create or replace procedure batchUpdateCustomer(p_age in number) as
begin
update CUSTOMERS set AGE=AGE+1 where AGE>p_age;
end;
以上存储过程有一个参数p_age,代表客户的年龄,应用程序可按照以下方式调用存储过程:
代码内容
tx = session.beginTransaction();
Connection con=session.connection();
String procedure = "{call batchUpdateCustomer(?) }";
CallableStatement cstmt = con.prepareCall(procedure);
cstmt.setInt(1,0); //把年龄参数设为0
cstmt.executeUpdate();
tx.commit();
从上面程序看出,应用程序也必须绕过Hibernate API,直接通过JDBC API来调用存储过程。
3:还是用Hibernate API 来进行常规的批量处理,可以也有变,变就变在,我们可以在查找出一定的量的时候,及时的将这些数据做完操作就删掉,session.flush();session.evict(XX对象集); 这样也可以挽救一点性能损失。这个“一定的量”要就要根据实际情况做定量参考了。。
(实例为 保存操作)
业务逻辑为:我们要想数据库插入10 0000 条数据
tx=session.beginTransaction();
for(int i=0;i[size=x-small;] {
session.flush();
session.clear();
}
}
这样可以把系统维持在一个稳定的范围
批量插入:
//打开session
Session session = sessionFactory.openSession();
Transaction tx = session.begainTransaction();
//循环100000次,插入100000条记录
for(int i = 0;i<=100000;i++){
//创建User实例
User u1 = new User();
u1.setName("XXXX"+i);
u1.setAge(i);
u1.setAddress("China");
//在Session级别缓存user实例
session.save(u1);
//每当累加器是20 的倍数时,将session中的数据刷如数据库,并清空session缓存
if(i%20==0){
session.flush();
session.clear();
tx.commit();
tx = session.beginTransaction();
}
}
//提交事物
tx.commit();
//关闭事物
hibernateUtil.closeSession();
hibernate中2级缓存还需配置:hibernate.cache.use_second_level_cache false
批量更新:
//打开session
Session session = sessionFactory.openSession();
//开始事物
Transaction tx = session.begainTransaction();
//查询出User表中的所有数据
ScrollableResult user = session.createQuery("from user")
.setCacheMode(Cache.Mode.IGNORE).scroll(ScrollMode.FOREARD_ONLY);
int count = 0;
//遍历user表中所有的记录
while (user.next()){
User u = (User)users.get(0);
u.setName("新用户名"+count);
//当count为20的倍数时,将更新的结果从session中刷新到数据库
if(++count%20==0){
session.flush();
session.clear();
}
}
//提交事物
tx.commit();
//关闭事物
hibernateUtil.closeSession();
但是这种风格的语句性能较低
可以使用hibernate提供的HQL批量的更新和删除 UPDATE|DELETE FROM? ClassName [WHERE WHERE_CONDITIONS]
假设批量更新User类实例的name属性,可以如下代码:
private void testUser()throws Exception{
//打开session
Session session = sessionFactory.openSession();
//开始事物
Transaction tx = session.begainTransaction();
//定义批量更新的HQL语句
String hqlUpdate = "update User set name =:newName";
//执行更新
int updateEntities = session.createQuery(hqlUpdate)
.setString("newName","新名字").executeUpdate();
//提交事物
tx.commit();
//关闭事物
hibernateUtil.closeSession();
}
批量的删除HQL:
private void testUser()throws Exception{
//打开session
Session session = sessionFactory.openSession();
//开始事物
Transaction tx = session.begainTransaction();
//定义批量更新的HQL语句
String hqlUpdate = "delete User";
//执行批量删除
int updateEntities = session.createQuery(hqlUpdate).executeUpdate();
//提交事物
tx.commit();
//关闭事物
hibernateUtil.closeSession();
}
Query.executeUpdate()方法返回 的是一个整型值,该值是受此操作影响的记录条数
hibernate3.0 实现了批量的增、删、改的操作。就是了insert/delete/update可以批量的实现。但是不建议使用,因为当执行了批量的update delete insert后,当执行session.commit()时,数据库中更新后的数据了,可是缓存里面不会改。它跟session不同,当session.update(),修改一个数据后,当执行session..commit()后,数据库中的数据会改变,同时缓存中的数据也会发生改变。这样就不会产生数据的不一致。
而这种批量的语句,如delete update insert会把数据库中的数据修改,例如,要改一万条数据,数据库中的1万条数据都会改变了。但是缓存里面不会变。 这样当再使用这个数据时,就可以有问题,因为出现脏数据了。缓存里面的数据跟数据库里面的数据根本就不一样。所以我们就建议使用。那么什么时候使用呢?除非这个数据变化不是很大。如果这个数据相对于静态,就是很长时间才会更新一下。这样就没有问题。。因为在这很长时间内,如果把session关闭了,则缓存里面就没有数据了。下次再修改时,就不会出现因为数据不一致而发生错误了。
一、
测试类:
package com.bjsxt.hibernate;
import java.util.Iterator;
import java.util.List;
import org.hibernate.Session;
import junit.framework.TestCase;
public class DMLQuertTest extends TestCase {
public void testQuery1(){
Session session=null;
try{
session=HibernateUtils.getSession();
session.beginTransaction();
session.createQuery("update Student s set s.name=? where s.id<?")
.setParameter(0,"李四")
.setParameter(1,Integer.valueOf("5")).executeUpdate();
List students=session.createQuery("select s from Student s where s.id<?").setParameter(0, Integer.valueOf("5")).list();
for(Iterator iter=students.iterator();iter.hasNext();){
Student student=(Student)iter.next();
System.out.println(student.getId()+","+student.getName());
}
session.getTransaction().commit();
}catch(Exception e){
e.printStackTrace();
}finally{
HibernateUtils.closeSession(session);
}
}
?
}
如果在sesson关闭之间,数据应该是不一致吧?
执行后生成SQL:
update t_student set name=? where id<?
显示为:
李四
李四
李四
李四
在MysQL环境下,输入select * from t_student; 时这些名字已经改为李四了。
之所以出现这样的情况,是因为数据很少,所以能够放到sessin的缓存里面,所以就放到里面了哦!所以数据就一致了哦!可是我们不能保存在修改一万条或是10万条记录时会不会致哦!
二、11、DML风格的操作(尽量少用,因为和缓存不同步)
*不像我们的sessin.save()方法,当执行save()时,会先放到缓存里面一份,当执行session.getTransaction().commit()方法时,
也就是commit()提交事务时,数据库里面也有数据了。
*可是如果用批量的insert()语句,当commit()时,数据库中确实会有修改后的数据,可是缓存里面不会加。如果我们是拿到缓存中的数据,把它改了,
那么缓存里面还是以前的数据。
*解析:为什么会是这样的?因为如果我们要批量的执行2万条update语句。只要将条件加到HQL查询语句的where子句中就可以了。
可是如果缓存里面也有这2万条记录,会给Hibernate造成很大的压力。其他的线程都会阻塞在那里,Hibernate就用不了了。
之所以Hibernate没有做这样的批量修改,因为这不是Hibernate擅长的,它擅长的是加载一个领域对象,然后编辑,然后修改。
*Hibernate 3.0 以前的版本,都没有 update insert delete语句呢。是到3.0后接加了这样的接口。
*如果想批量做什么事,可以使用SQL语句来实现。
?
三、所以说Hibernate不适合做聚集性的操作。如批量修改,大量的数据统计。因为会存在数据库中的数据与缓存不同步的问题
四、但是我们像上面,做少量的数据修改,是可以同步的哦