黑色乏味-优快云博客

原创孔网寻书使用 - 孔夫子采集软件 - 孔网采集-核价

该软件是针对孔网平台的数据采集与核价工具，主要功能包括：1.需代理IP支持，内置低价代理；2.自动分表存储（超80万数据自动新建表）；3.支持多开但需分文件夹管理。核心功能有：孔销量查询（可设置销量区间采集平均价）、孔网核价（支持缓存核价1秒千条和实时核价）、孔网分类采集（支持书目/商品链接）、店铺采集（可批量处理链接）。特别提供核价数据处理工具，能自动分离无利润/无货商品，建议先用缓存核价再补实时核价提高效率。所有数据均保存在当前目录info文件夹，采集时请勿打开保存文件。

2025-10-04 17:44:52 392

原创孔夫子旧书网采集软件 - 孔网寻书

功能页面:小规模测试直接填入isbn即可，如果需要大规模采集的话，必须上传文件，这样做的目的是防止数据量过大，导致软件解析卡死填了isbn就不需要上传文件了，程序会自动判断，上传文件跟填写isbn只选其一即可隧道代理是必填项，因为这个功能涉及到了cookie,如果不加代理裸跑cookie的话很容易导致账号被封。采集后的信息会自动保存到当前目录下info文件夹。

2024-10-06 13:56:05 1405

原创 streamlit部署至宝塔面板，全网最简单部署方式！！

因为懒得写前端，就用了python懒人库streamlit，但是官方文档里除了在git上部署并没有详细的在其他环境部署的教程，并且我找遍了全网的资料，都是一群垃圾文章，看得我内心极度不爽！！！都用宝塔了为什么还搞得这么复杂？经过我2个小时的研究，总算是研究出最简单的部署方法了。

2024-01-09 14:26:11 2122 1

原创 2023最新某东商品抢购

支持多商品多用户多线程,

2023-10-25 13:54:20 182

原创谷歌浏览器headers自动换行解决方法

但是谷歌浏览器最新版本复制粘贴下来的header信息会自动换行。在请求接口的时候很多时候需要用到header，3.搜索headers,然后取消掉这个实验项目。2：选择设置里的实验。

2023-08-30 13:41:35 1922 7

原创安装pyinstaller失败处理方法

1.其实一点也不麻烦2.先“pip install pywin32”3.在“pip install wheel”4.试一下“pip install pyinstaller”

2022-04-20 00:38:59 2271

原创 python通过异步爬取小说

本次爬取目标网址:长夜余火(爱潜水的乌贼)_长夜余火最新章节 - 笔趣阁不难看出首页包含所有文章的链接，那么我们第一步就先获取说有章节的链接。首先引入所需要的库:import asyncioimport requestsimport aiohttpfrom lxml import etreeimport csv然后创建一个获取链接的函数,刚获取到的链接是不完整的，所以需要拼接就这样我们创建好了一个获取所有章节链接的函数:def get_url(): ...

2022-04-17 17:20:25 1318 3

原创解决python中aiohttp证书出错的问题

报错:raise ClientConnectorCertificateError(req.connection_key, exc) from excaiohttp.client_exceptions.ClientConnectorCertificateError: Cannot connect to host cuiqingcai.com:443 ssl:True [SSLCertVerificationError: (1, '[SSL: CERTIFICATE_VERIFY_FAILED] certif

2022-04-17 11:24:01 6778 1

weixin_45727633的博客