12.15日进步单进程和双进程

本文介绍了一种使用Python多进程技术进行网页数据抓取的方法,通过对比单进程与多进程的执行效率,展示了多进程在处理大规模数据时的优势。文章详细讲解了如何利用multiprocessing模块并行执行网络请求,加速数据抓取过程。

代码

# coding=utf-8
import multiprocessing
import os
from pyquery import PyQuery as pq
import requests
import csv
import time

def action(key):
    head = {
    'Upgrade-Insecure-Requests':'1',
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
    }
    for i in range(1,50):
        page = []
        url = 'https://www.yuanjisong.com/consultant/allcity/' + key + '/page' + str(i)
        response = requests.get(url,headers=head)
        doc = pq(response.text)
        boxs = doc('.weui_panel.weui_panel_access.weui_panel_access_adapt.db_adapt.margin-top-2').items()  
        for box in boxs:
            box_text = box.text()
            page.append(box_text.split('\n'))
        path = 'I:/'+ key + '.csv'
        with open(path,'a',encoding='utf-8-sig') as f:
            writer = csv.writer(f)
            writer.writerows(page)
        print('保存' + key + '第' + str(i) + '页!')

单进程测试代码:

if __name__ == '__main__':
    a = time.time()
    action('python')
    action('java')
    print('it\'over!')
    print('单进程花费时间',time.time() - a)

花费时间:
111

双进程测试代码

if __name__ == '__main__':
    a = time.time()
    mp1 = multiprocessing.Process(target=action,args=('python',))
    mp1.start()
    mp2 = multiprocessing.Process(target=action,args=('java',))
    mp2.start()
    mp2.join()
    print('it\'over!')
    print('多进程花费时间',time.time() - a)

花费时间:
在这里插入图片描述

多进程池(数据量是刚才上面两个的10倍)

if __name__ == '__main__':
    a = time.time()
    keys =['java','php','python','node','net','ruby','cplus',\
        'quanzhan','ios','android','qianduan','houduan','ui','chanpin','yunying','ceshi','other']
    #数据成倍的增加
    pool = multiprocessing.Pool(processes=len(keys))
    pool.map(action,keys)
    pool.close()
    pool.join()
    print('it\'s over!')
    print('多进程花费时间',time.time() - a)

花费时间:
在这里插入图片描述

考虑可再生能源出力不确定性的商业园区用户需求响应策略(Matlab代码实现)内容概要:本文围绕“考虑可再生能源出力不确定性的商业园区用户需求响应策略”展开,结合Matlab代码实现,研究在可再生能源(如风电、光伏)出力具有不确定性的背景下,商业园区如何制定有效的需求响应策略以优化能源调度提升系统经济性。文中可能涉及不确定性建模(如场景生成与缩减)、优化模型构建(如随机规划、鲁棒优化)以及需求响应机制设计(如价格型、激励型),并通过Matlab仿真验证所提策略的有效性。此外,文档还列举了大量相关的电力系统、综合能源系统优化调度案例与代码资源,涵盖微电网调度、储能配置、负荷预测等多个方向,形成一个完整的科研支持体系。; 适合人群:具备一定电力系统、优化理论Matlab编程基础的研究生、科研人员及从事能源系统规划与运行的工程技术人员。; 使用场景及目标:①学习如何建模可再生能源的不确定性并应用于需求响应优化;②掌握使用Matlab进行商业园区能源系统仿真与优化调度的方法;③复现论文结果或开展相关课题研究,提升科研效率与创新能力。; 阅读建议:建议结合文中提供的Matlab代码实例,逐步理解模型构建与求解过程,重点关注不确定性处理方法与需求响应机制的设计逻辑,同时可参考文档中列出的其他资源进行扩展学习与交叉验证。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值