利用子进程高效导出百万以上数据

文章介绍了一种通过PHP的pcntl_fork函数实现多进程来提高Excel数据导出效率的方法。将大数量级(如200W)的数据分为多个部分,每个部分在子进程中独立导出,最后合并所有子进程生成的CSV文件,实现在200W数据导出上花费不到220秒的时间。

如果你导出的Excel没有什么高级用法的话,只是做导出数据用那么建议使用本方法,要比PHPexcel要高效的多。
这边用的是用的多进程的方式来完成导出的。比如我现在要导出200W数据,我就按20W数据分配一个子进程的方式,这样就需要分配10个子进程, 每个进程完成20W数据的导出。然后把导入的后的数据合并下就完成了200W数据的导入。看下面具体代码:

<?php
namespace console\controllers;

use Yii;
use yii\console\Controller;
use common\helpers\CommonFun;

class ExportController extends Controller
{
    protected $csvPath;
    protected $user;
    protected $size = 1000;
    protected $step = 200000;

        

    //多进程的脚本
    public function actionSend($count)
    {
        if (!$count) exit('count is zero');
        $taskStartTime = microtime(true);
        //创建目录
        if (!file_exists($this->csvPath)) {
            CommonFun::recursionMkDir($this->csvPath);
        }
        $totalNum = ceil($count/$this->step);
        $childs = array();
        for($i=0; $i< $totalNum; $i++) {
            $pid = pcntl_fork();
            if ($pid == -1) {
                exit('Could not fork');
            } elseif($pid) {
                echo "I'm the Parent $i\n";
                $childs[] = $pid;
            } else {
                //子进程处理业务
                $this->handelChildProcess($i,$count);
            }
        }

        while (count($childs) > 0) {
            foreach ($childs as $key => $pid) {
                $res = pcntl_waitpid($pid, $status, WNOHANG);
                //-1代表error, 大于0代表子进程已退出,返回的是子进程的pid,非阻塞时0代表没取到退出子进程
                if ($res == -1 || $res > 0) {
                    echo "$key=> $pid\n";
                    unset($childs[$key]);
                }
            }
            sleep(1);
        }
        $lastTime = $this->getElapsedTime($taskStartTime);
        Yii::info("toallastTime|"  . $lastTime, __METHOD__);
        exit("success|$lastTime");
    }

    public function getRows($start) {
        $size = $this->size;
        $end = $start + $size;
        $userList = Yii::$app->db_uums->createCommand('SELECT  field1,field2,field3,field4, field5  FROM `user` where (field4=2 or field4=4) LIMIT '. $size .  ' OFFSET '  . $start)->queryAll();
        foreach ($userList as  $value) {
            yield $value;
        }
    }

    public function handelChildProcess($processKey, $totalCount)
    {
        echo "process $processKey start \n";
        $taskStartTime = microtime(true);
        $pageTotal = ceil($this->step/$this->size);
        for ($i=1; $i <= $pageTotal; $i++) {
            //计算起始位置
            $start = $processKey * $this->step + ($i-1) * $this->size;
            if ($start > $totalCount) {
                $lastTime = $this->getElapsedTime($taskStartTime);
                Yii::info("lastTime|process" . $processKey . $lastTime, __METHOD__);
                echo "process $processKey end\n";
                exit('超过总数了');
            }
            $userList = $this->getRows($start);
            foreach ($userList as $key => $value) {
                $this->writeRow($value, $this->csvPath . '/' . $this->user . $processKey . '.csv');
            }
            sleep(1);
        }
        $lastTime = $this->getElapsedTime($taskStartTime);
        Yii::info("lastTime|process" . $processKey . '|' . $lastTime, __METHOD__);
        echo "process $processKey end\n";
        exit($lastTime);
    }

    public function getElapsedTime($startTime) {
        $endTime = microtime(true);
        $elapsedTime = number_format($endTime- $startTime, 4);
        return $elapsedTime;
    }


    public function writeRow($row, $file) {
        $row = array_map(function($v){
            return iconv('utf-8', 'gbk//IGNORE', $v);
        },$row);
        $handle = fopen($file,'a');
        fputcsv($handle, $row);
    }
}

执行代码:

php yii export/send 2000000

经测试导入200W数据只花了不到220s,看下面测试结果

导出的数据:

➜  csv git:(master) ✗ wc -l *     
   200199 user0.csv
   200200 user1.csv
   200200 user2.csv
   200200 user3.csv
   200202 user4.csv
   200200 user5.csv
   200200 user6.csv
   200200 user7.csv
   200200 user8.csv
   200206 user9.csv
  2002007 total
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值