python_爬虫入门

爬取的网站'http://quote.eastmoney.com/stocklist.html'

'https://gupiao.baidu.com/stock/'

准备工作首先安装requests 库 和 Beautifulsoup两个库爬取的内容是股票的交易信息

一、所有的爬虫第一布请求连接

import requests
import re
from bs4 import BeautifulSoup

def getHtmlText(url):
    '''
    向网页发送请求,接受响应信息    
    :param url: 请求网址连接
    :return: r.text返回的是页面的响应内容
    '''
    try:
        r=requests.get(url)
        #抓取连接的异常
        r.raise_for_status()
        #将抓取的信息转换成utf-8
        r.encoding='utf-8'
        return r.text
    except:
        return '连接异常'


二、我们要去处理我们爬取的内容进行处理

def getCaifuStockLis(StockCaifuurl,lst):
    '''
    通过财富网取得所有股票的交易码
    :param StockCaifuurl:财富网连接 
    :param lst: 储存所有股票的代码
    :return: 
    '''
    #获得财富网的响应内容
    html = getHtmlText(StockCaifuurl)
    #解析财富网
    soup = BeautifulSoup(html, 'html.parser')
    #得到所有a标签
    a = soup('a')
    for items in  a:
        try:
            #得到所有属性是href
            href=items.attrs['href']
            #通过正则匹配
            lst.append(re.findall(r'[s][hz]\d{6}',href)[0])
        except:
            #有问题的直接跳过本次循环
            continue

def  getStockInfo(lit,stockUrl,fpath):
    '''
    
    
    :param lit:  股票代号 
    :param stockUrl: 拼接的连接头部
    :param fpath: 
    :return: 
    '''

    #进度条
    count = 0
    for  i_url in lit:
        #拼接连接
        url=stockUrl+i_url+'.html'
        html = getHtmlText(url)
        try:
            if html=='':
                continue
            infoDict={}
            soup =BeautifulSoup(html, 'html.parser')
            class_attrs = soup.find("div",attrs={'class':'stock-info'})
            name =class_attrs.find_all(attrs={'class': 'bets-name'})[0]
            #保存股票的名字
            infoDict.update({"股票名":name.text.split()[0]})
            keystock = class_attrs('dt')
            valuestock = class_attrs('dd')
            for i in range(len(keystock)):
                key = keystock[i].text
                val = valuestock[i].text
                infoDict[key] = val
            with open(fpath,'a',encoding="utf-8") as f:
                f.write(str(infoDict)+'\n')
                count = count + 1
                print("\r当前进度: {:.2f}%".format(count * 100 / len(lit)), end="")

        except:
            print("\r异常当前进度: {:.2f}%".format(count * 100 / len(lit)), end="")
            continue






def main():
    lit=[]
    stock_list_url = 'http://quote.eastmoney.com/stocklist.html'
    stock_info_url = 'https://gupiao.baidu.com/stock/'
    output_file = 'D:/BaiduStockInfo.txt'
    getCaifuStockLis(stock_list_url,lit)
    getStockInfo(lit, stock_info_url, output_file)
main()




混合动力汽车(HEV)模型的Simscape模型(Matlab代码、Simulink仿真实现)内容概要:本文档介绍了一个混合动力汽车(HEV)的Simscape模型,该模型通过Matlab代码和Simulink仿真工具实现,旨在对混合动力汽车的动力系统进行建模与仿真分析。模型涵盖了发动机、电机、电池、传动系统等关键部件,能够模拟车辆在不同工况下的能量流动与控制策略,适用于动力系统设计、能耗优化及控制算法验证等研究方向。文档还提及该资源属于一个涵盖多个科研领域的MATLAB仿真资源包,涉及电力系统、机器学习、路径规划、信号处理等多个技术方向,配套提供网盘下载链接,便于用户获取完整资源。; 适合人群:具备Matlab/Simulink使用基础的高校研究生、科研人员及从事新能源汽车系统仿真的工程技术人员。; 使用场景及目标:①开展混合动力汽车能量管理策略的研究与仿真验证;②学习基于Simscape的物理系统建模方法;③作为教学案例用于车辆工程或自动化相关课程的实践环节;④与其他优化算法(如智能优化、强化学习)结合,实现控制策略的优化设计。; 阅读建议:建议使用者先熟悉Matlab/Simulink及Simscape基础操作,结合文档中的模型结构逐步理解各模块功能,可在此基础上修改参数或替换控制算法以满足具体研究需求,同时推荐访问提供的网盘链接获取完整代码与示例文件以便深入学习与调试。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值