爬虫 -- httpx封装
于 2022-02-15 14:29:41 首次发布
本文介绍了一个使用 asyncio 和 ddddocr 的异步爬虫,它能进行网页抓取并利用 OCR 技术识别内容。核心内容包括随机生成 User-Agent,处理GET和POST请求,以及通过 DdddOcr 进行文字识别。
本文介绍了一个使用 asyncio 和 ddddocr 的异步爬虫,它能进行网页抓取并利用 OCR 技术识别内容。核心内容包括随机生成 User-Agent,处理GET和POST请求,以及通过 DdddOcr 进行文字识别。
2169
732
930
1709
828
6292

被折叠的 条评论
为什么被折叠?