
python网络爬虫
文章平均质量分 86
Little_Yuu
Life must be pythonic.
展开
-
基于DrissionPage的企查查数据采集器
为引导信贷资金快速直达基层小微企业,由金融监管总局、国家发展改革委牵头,建立了支持小微企业融资协调工作机制,地方相应建立工作机制,从供需两端发力,统筹解决小微企业融资难和银行放贷难的问题。当地政府积极响应,积极向银行提供可能有融资需求的当地小微企业名单,名单所有内容均为公开信息,仔细分析名单后发现,部分企业已注销或处于其他异常状态,所有企业均无企业主联系方式,故本文主要解决两个问题:(1)企业状态;(2)企业联系方式。本文使用DrissionPage自动化工具在企查查上获取上诉企业信息。原创 2024-12-03 19:34:54 · 357 阅读 · 1 评论 -
python网络爬虫——使用selenium抓取东方财富网上市公司公告
@TOC一、在爬取公告之前需要了解一些基本信息(1)东方财富网是否需要登陆才能查看全部股票信息不需要二、使用selenium操作浏览器获取数据的基本流程(1)打开“东方方财富网>数据中心>公告大全>沪深A股公告”页面;(2)在“个股公告查询”输入框中数据需要查询的股票代码,并点击“查询”按钮;(3)此时浏览器会自动在新的窗口打开指定股票公告页面;(4)遍历所有公告...原创 2020-06-19 01:02:38 · 7475 阅读 · 6 评论 -
python网络爬虫之Max retries exceeded with url错误
ConnectionError: HTTPSConnectionPool(host=‘cq.feibaos.com’, port=443): Max retries exceeded with url: /news/lists-notice.html?req=t11-320100&word=&idx=49 (Caused by NewConnectionError(’<urllib3.connection.VerifiedHTTPSConnection object at 0x7fc4原创 2020-06-19 00:59:29 · 920 阅读 · 0 评论