- 博客(8)
- 收藏
- 关注
原创 孔网寻书使用 - 孔夫子采集软件 - 孔网采集-核价
该软件是针对孔网平台的数据采集与核价工具,主要功能包括:1.需代理IP支持,内置低价代理;2.自动分表存储(超80万数据自动新建表);3.支持多开但需分文件夹管理。核心功能有:孔销量查询(可设置销量区间采集平均价)、孔网核价(支持缓存核价1秒千条和实时核价)、孔网分类采集(支持书目/商品链接)、店铺采集(可批量处理链接)。特别提供核价数据处理工具,能自动分离无利润/无货商品,建议先用缓存核价再补实时核价提高效率。所有数据均保存在当前目录info文件夹,采集时请勿打开保存文件。
2025-10-04 17:44:52
392
原创 孔夫子旧书网采集软件 - 孔网寻书
功能页面:小规模测试直接填入isbn即可,如果需要大规模采集的话,必须上传文件,这样做的目的是防止数据量过大,导致软件解析卡死填了isbn就不需要上传文件了,程序会自动判断,上传文件跟填写isbn只选其一即可隧道代理是必填项,因为这个功能涉及到了cookie,如果不加代理裸跑cookie的话很容易导致账号被封。采集后的信息会自动保存到当前目录下info文件夹。
2024-10-06 13:56:05
1405
原创 streamlit部署至宝塔面板,全网最简单部署方式!!
因为懒得写前端,就用了python懒人库streamlit,但是官方文档里除了在git上部署并没有详细的在其他环境部署的教程,并且我找遍了全网的资料,都是一群垃圾文章,看得我内心极度不爽!!!都用宝塔了为什么还搞得这么复杂?经过我2个小时的研究,总算是研究出最简单的部署方法了。
2024-01-09 14:26:11
2122
1
原创 谷歌浏览器headers自动换行解决方法
但是谷歌浏览器最新版本复制粘贴下来的header信息会自动换行。在请求接口的时候很多时候需要用到header,3.搜索headers,然后取消掉这个实验项目。2:选择设置里的实验。
2023-08-30 13:41:35
1922
7
原创 安装pyinstaller失败处理方法
1.其实一点也不麻烦2.先“pip install pywin32”3.在“pip install wheel”4.试一下“pip install pyinstaller”
2022-04-20 00:38:59
2271
原创 python通过异步爬取小说
本次爬取目标网址:长夜余火(爱潜水的乌贼)_长夜余火最新章节 - 笔趣阁不难看出首页包含所有文章的链接,那么我们第一步就先获取说有章节的链接。首先引入所需要的库:import asyncioimport requestsimport aiohttpfrom lxml import etreeimport csv然后创建一个获取链接的函数,刚获取到的链接是不完整的,所以需要拼接就这样我们创建好了一个获取所有章节链接的函数:def get_url(): ...
2022-04-17 17:20:25
1318
3
原创 解决python中aiohttp证书出错的问题
报错:raise ClientConnectorCertificateError(req.connection_key, exc) from excaiohttp.client_exceptions.ClientConnectorCertificateError: Cannot connect to host cuiqingcai.com:443 ssl:True [SSLCertVerificationError: (1, '[SSL: CERTIFICATE_VERIFY_FAILED] certif
2022-04-17 11:24:01
6778
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅