Excel批量导入、导出

1.Mybatis的执行器(了解)

执行器(Executor)是一个核心组件,负责处理SQL语句的执行、结果集的处理、事务管理以及缓存机制。

执行器的主要职责包括:

  1. SQL执行:执行器根据传入的SQL语句和参数,生成并发送到数据库执行。

  2. 结果映射:执行SQL语句后,执行器会将数据库返回的结果集映射到Java对象上,这个过程称为结果映射。

  3. 事务管理:执行器负责处理事务的开始、提交或回滚,确保数据的一致性和完整性。

  4. 缓存机制:执行器管理一级缓存(本地缓存)和二级缓存(跨SqlSession的缓存),可以有效减少数据库访问次数,提高应用性能。

  5. 批处理:某些执行器类型(如REUSEBATCH)支持批处理操作,可以一次性执行多条SQL语句,减少网络往返次数,提高执行效率。

在进行Excel批量导入导出时需要了解执行器的 批处理 职责。

2.执行器(Executor)的类型

1.ExecutorType.SIMPLE:

ExecutorType.SIMPLE是默认的执行方式。

每次执行SQL语句时,都会打开一个新的PreparedStatement对象。

每条SQL语句都会立即被执行并提交到数据库。

适用于常规的单个或少量SQL操作。

注:PreparedStatement对象是 Java 中用于执行预编译 SQL 语句的接口。PreparedStatement 具有以下特点:①预编译②参数化查询(防止SQL注入)③性能优化

2. ExecutorType.BATCH:

ExecutorType.BATCH会将一批SQL语句集中在一起批量执行,减少了与数据库的交互次数,提高性能。

多条SQL语句会一起提交到数据库执行,可以提升执行效率。

可以通过 sqlSessionFactory.openSession(ExecutorType.BATCH) 方法手动触发批量执行。

适用于需要执行大量SQL操作的场景,如批量插入、更新或删除多条记录。

3.ExecutorType.REUSE

当多次调用相同的SQL语句时,会重用已编译的SQL语句和执行计划。

适用于单条SQL语句的重复执行,例如在一个循环中多次执行相同的SQL语句。

每次执行都会创建一个新的Statement对象,但会重用已编译的SQL语句和执行计 划,以提高执行效率。

执行器类型总结:

ExecutorType.SIMPLE 适用于常规的单个或少量SQL操作;ExecutorType.BATCH 批量执行大量SQL操作的场景;ExecutorType.REUSE 适用于单条SQL语句的重复执行。

3.代码实现:

需要的依赖:

<dependency>
            <groupId>cn.hutool</groupId>
            <artifactId>hutool-all</artifactId>
            <version>5.8.16</version>
        </dependency>
        <dependency>
            <groupId>org.projectlombok</groupId>
            <artifactId>lombok</artifactId>
        </dependency>
        <dependency>
            <groupId>org.mybatis.spring.boot</groupId>
            <artifactId>mybatis-spring-boot-starter</artifactId>
            <version>2.3.0</version>
        </dependency>
        <dependency>
            <groupId>com.alibaba</groupId>
            <artifactId>easyexcel</artifactId>
            <version>4.0.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>5.1.0</version>
        </dependency>

        <dependency>
            <groupId>mysql</groupId>
            <artifactId>mysql-connector-java</artifactId>
            <scope>runtime</scope>
        </dependency>

Excel数据批量导入数据库

 @PostMapping
    public String insertExcel1() throws Exception {
        // 使用Hutool读取Excel文件
        ExcelReader reader = ExcelUtil.getReader("D:\\Download\\AA\\file.xlsx");
        //将读取到的 reader 转化为 List<Map>集合
        List<Student> students = reader.readAll(Student.class);

        //StopWatch类是 Hutool 工具库中的类,用于测量代码执行时间
        StopWatch stopWatch = new StopWatch();
        //读取数据的结束时间同时也是写入数据库的开始时间
        stopWatch.start();
        //sqlSessionFactory是通过ioc容器注入的  设置其SqlSession的执行器格式
ExecutorType.SIMPLE(默认)
        //通过 sqlSessionFactory 创建一个使用批处理执行器并且不自动提交事务的 SqlSession 实例
        SqlSession sqlSession = sqlSessionFactory.openSession(ExecutorType.BATCH, false);
        ExcelMapper mapper = sqlSession.getMapper(ExcelMapper.class);
        //循环将List<Map>中的数据插入数据库
        for (Student student : students) {
            mapper.insert(student);
        }

        //批量插入
//        mapper.insertBatch(students);
        sqlSession.commit();
        stopWatch.stop();
        sqlSession.close();
        System.out.println("插入数据库最终的结果为:" + stopWatch.getTotalTimeSeconds());

        return "ok";
    }
  1. sqlSessionFactory.openSession(...):这是通过 SqlSessionFactory 实例来打开一个 SqlSession 的方法。SqlSessionFactory 是 MyBatis 的核心接口之一,用于创建 SqlSession 实例。

  2. ExecutorType.BATCH:这个参数指定了 MyBatis 应该使用哪种执行器(Executor)来执行SQL语句。ExecutorType.BATCH 表示使用批处理执行器。批处理执行器会收集所有的SQL语句,在会话结束时(即调用 session.commit() 或 session.rollback() 时)一次性将它们发送到数据库执行。这对于需要执行大量插入、更新或删除操作的情况特别有用,因为它可以显著提高性能。

  3. false:这个参数指定了是否自动提交事务。在这个例子中,传递了 false,意味着事务不会自动提交。这意味着你需要在适当的时候手动调用 session.commit() 来提交事务,或者在需要时调用 session.rollback() 来回滚事务。这提供了更细粒度的事务控制。

使用批处理执行器时,你应该注意以下几点:

  • 确保在会话结束时正确提交或回滚事务,以避免数据不一致。
  • 批处理执行器可能会占用更多的数据库连接资源,因此在使用时要考虑数据库的连接池配置。
  • 由于批处理执行器会延迟SQL语句的执行,因此在执行过程中可能会遇到一些与立即执行SQL语句不同的行为(例如,某些数据库约束可能在批处理结束时才得到验证)。

数据库数据批量导出Excel表

同时大量数据导出需要计算分页参数,调用Mapper方法获取数据,然后使用EasyExcel进行数据导出。这里的关键是每次只从数据库中获取一部分数据,然后写入Excel,避免一次性加载大量数据导致内存溢出。所以使用分页查询。

在数据库查询中,`OFFSET`关键字主要用于分页查询,它指定了查询结果中应该跳过的初始记录数。`OFFSET`通常与`LIMIT`关键字一起使用,以实现从数据库中检索特定范围的记录

SELECT * FROM table_name
  OFFSET 10
  LIMIT 20;

OFFSET 10 意味着查询将跳过前10条记录。

LIMIT 20 意味着查询将返回接下来的20条记录。

OFFSET 0 LIMIT 10 :相当于从0开始查询,返回十条结果。

 @GetMapping("/write")
    public void exportExcel() throws IOException {
        // 设置文件保存路径
        String filePath = "D:\\Download\\AA\\test1.xlsx";

        // 创建Excel写入器
        File file = new File(filePath);
        // 检查文件是否存在,如果不存在则创建
        if (!file.exists()) {
            // 创建父目录
            file.getParentFile().mkdirs();
            // 创建文件
            file.createNewFile();
        }

        // 创建ExcelWriter对象(写入器),参数为文件路径
        ExcelWriter writer = EasyExcel.write(file.getPath()).build();
        //读取到一张表中,调用EasyExcel工具类读取数据,并将结果写入到指定的Sheet中,
        // .head 会根据这个类的属性自动生成Excel的标题行。
        WriteSheet sheet = EasyExcel.writerSheet("Sheet1").head(Student.class).build();

        // 分页参数
        int pageNum = 1;
        int pageSize = 10000; // 每次读取的数量,根据实际情况调整

        // 循环读取数据,直到没有数据为止
        boolean hasMore = true;
        while (hasMore) {
            //从第几条开始查询。
            int offset = (pageNum - 1) * pageSize;
            List<Student> students = excelMapper.selectAllByPage(offset, pageSize);
            //批量导出多张表
            // WriteSheet sheet = EasyExcel.writerSheet("Sheet" + pageNum).head(Student.class).build();
            //检查查询结果是否为空,如果不为空,说明还有数据需要写入。
            if (!students.isEmpty()) {
                writer.write(students, sheet);
                pageNum++;
            } else {
                hasMore = false;
            }
        }


        // 完成写入,结束并释放ExcelWriter对象占用的所有资源
        writer.finish();
    }

多线程导入数据到数据库中

理论上使用多线程导入数据时,数据库中数据的顺序不能确定。这是由多线程环境的本质所决定的,因为在多线程环境下,线程的调度是由操作系统或JVM调度器控制的,这导致线程的执行顺序不可预测。

即使线程按照一定的顺序开始执行,由于网络延迟、数据库锁、查询优化等因素,实际数据插入到数据库中的顺序也可能与预期的不同。

就算 使用自定义的有序队列,或者使用LinkedBlockingQueueArrayBlockingQueue都有序队列。两者是按照先进先出(First-In-First-Out, FIFO)原则工作的队列,这意味着它们在概念上都是有序的;由于多个线程可能同时从队列中取出元素,实际的处理顺序可能会因为线程调度的不确定性而略有不同。

  @PostMapping("/insertExcel2")
    public String insertExcel2() {
        // 创建固定大小的线程池
        ExecutorService executor = Executors.newFixedThreadPool(10);

        // 读取Excel文件并获取Sheet对象
        ExcelReader reader = ExcelUtil.getReader(FileUtil.file("D:\\Download\\AA\\test1.xlsx"), "sheet1");
        // 获取Sheet对象
        Sheet sheet = reader.getSheet();

        // 获取当前时间
        long startTime = System.currentTimeMillis();

        // 获取总行数
        int totalRows = sheet.getLastRowNum() + 1; // 注意:getLastRowNum()返回的是最后一行的索引,因此需要+1

        //定义各批次的处理数据量
        int batch = 1000;
        // 定义计数器,并计算需要的总批次数。
        CountDownLatch latch = new CountDownLatch(totalRows / batch + (totalRows % batch > 0 ? 1 : 0));


        for (int i = 1; i < totalRows; i += batch) {
            final int start = i;
            final int end = Math.min(i + batch - 1, totalRows);
            executor.submit(() -> {
                List<Student> read = reader.read(0, start, end, Student.class);
                excelMapper.insertBatch(read);
                // 一次插入事件完成之后,计数器减一。
                latch.countDown();
            });
        }

        try {
            // 等待所有任务完成
            latch.await();
            long endTime = System.currentTimeMillis();
            System.out.println("最终的结果为:" + (endTime - startTime));
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
            e.printStackTrace();
        } finally {
            // 关闭线程池
            executor.shutdown();
        }
        return "ok";
    }

https://meeting.tencent.com/v2/cloud-record/share?id=c17a8d67-9ec9-4479-9bd7-2fd57c38ef23&from=3

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

这孩子叫逆

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值