iFeng的小屋-优快云博客

原创【python爬取视频评论爬虫】一键获取视频下全部评论完整源代码

是中国知名的视频社区平台，以ACG（动画、漫画、游戏）内容起家，现已发展为涵盖多元文化的综合性视频网站。月活跃用户超3亿，日均使用时长约96分钟。拥有大量UP主（内容创作者），涵盖业余爱好者到专业机构。接下来我就介绍一下如爬取b站的某条视频下的全部评论。

2025-12-25 15:54:03 154

原创【python爬虫微博评论】根据帖子链接批量爬微博评论，含二级评论

微博是国内极具影响力的社交媒体平台，具有内容形式短平快、热点事件实时性强、舆论快速发酵、用户群体年轻且活跃等特点。其中，微博评论区是用户公开表达观点的重要场域，可通过评论区的数据，实时追踪情绪倾向、挖掘公众诉求、捕捉热点趋势、构建群体画像、从而进行社会学和传播学的研究等。基于此，我用python开发了一个爬虫采集软件，下边详细介绍。

2025-12-24 22:00:40 129

原创爬取当当网书籍信息实战学习，内附源代码（2026最新版）

3，一起学习交流，通过公中号 iFeng的小屋获取，有其他定制需要可以详细交流学习。当当网作为国内领先的电商平台，我们今天对它进行数据爬取。在数字阅读和在线图书销售飞速发展的今天，图书数据成为。书名，价格，出版社，简介，作者，评论数，发布时间。1，运行前需更换最新cookie。2，本作者一直在维护代码，确保您能顺利运行！2，这个代码可以指定爬取多少条数。

2025-12-23 21:57:48 145

原创【python微博帖子爬虫】2026最新！微博根据搜索关键词批量爬帖子，附源代码！

微博是国内非常流行的社交媒体平台，内容主要以文字和图片为主，在实时性和关注热度方面尤为突出。广大网友在微博平台大量输出自己的观点、看法，组成了一个活跃度极高的社区群体。每次热点事件爆发的时候，微博热搜也是所有媒体平台里最先曝光的平台。所以我用python进行了一个数据采集的脚本开发。1.2 数据截图微博帖子采集结果。

2025-12-22 18:36:11 159

原创【爬虫实战】手把手教你爬取微博数据，轻松获取任意用户全部微博！

可立即运行的爬虫脚本，详细的配置教程（含Cookie获取方法）。Python副业星球共重号可以获取完整源码和详细配置教程！大家有需要可以我们一起交流一下哦，相互学习！

2025-11-22 23:46:21 1069

原创 Python执行js报错:UnicodeEncodeError: ‘gbk’ codec can‘t encode character “lxa9’ in position 69188（）

最近在运行python执行js逆向时报错：UnicodeEncodeError: 'gbk’ codec can't encode character "lxa9’ in position 69188: illegal multibyte。下面我将讲述一些方法去彻底解决这个问题。以上三种方法均可解决这个问题。若你想获取更多干货或者学习的代码的话，可以找到公众号python副业星球，里边有很多干货内容，让我们一起学习成长。

2025-09-26 21:25:42 223

原创解决报错：execjs._exceptions.ProgramError: SyntaxError:缺少字符串（完美解决！）

上次给一位客户打包环境的时候，客户的电脑报execjs._exceptions.ProgramError: SyntaxError:缺少字符串这个错，而我的电脑却没有任何问题，我还检查代码好几遍，始终没有解决。最后才发现是客户没有环境的问题。

2025-09-19 22:16:21 327

原创【共重号爬虫采集软件】一键采集相关数据，功能强大！

本文介绍了一款Python开发的公众号文章批量下载工具，主要功能包括：支持关键词/反向关键词搜索、自定义日期范围爬取、选择性抓取文章内容、批量导入公众号等。工具可导出Excel格式数据，无需配置环境即可使用。

2025-08-23 17:42:25 209

原创爬取b站弹幕数据，轻松获取用户真实反馈！附完整Python代码+解析

大家好，今天给大家分享一个如何爬取B站弹幕数据的完整教程。弹幕作为B站独特的文化现象，蕴含着大量用户真实反馈，对于数据分析、舆情监控或趣味研究都非常有价值。下面我将介绍如何使用Python获取B站弹幕数据，并保存到Excel文件中。话不多说，直接开干！以上就是全部内容啦，如果你感兴趣的话欢迎关注我，我还会写更多对大家有帮助的代码，欢迎大家交流学习。欢迎大家在公重微号找python副业星球！有很多实用的代码！下期再见！

2025-08-20 00:27:07 384

原创 Python爬虫实战：百度搜索数据抓取代码全解析（Selenium自动化，后附完整代码）

本文介绍了利用Python爬取百度搜索关于GPT-5数据的方法。该爬虫程序能自动翻页采集搜索结果，包含页码、标题、链接和简介等字段，适合用于数据分析。代码采用多种异常处理机制确保稳定性，适合Python爬虫学习者参考。

2025-08-09 16:53:58 775

原创根据关键词抓取微博帖子python爬虫数据抓取保姆级步骤教程

本文介绍了使用Python爬取微博关键词相关数据的方法。通过requests和BeautifulSoup库实现爬取功能，包含用户信息、博文内容及互动数据（转发、评论、点赞）等字段的提取。文章详细讲解了请求头设置、时间范围限定、分页处理、长文本获取等关键步骤，并提供了异常处理和反爬策略。最终450+条数据通过pandas存储，完整代码可直接运行。

2025-08-06 16:24:02 1185 3

原创 http.client.RemoteDisconnected: Remote end closed connection without response相关问题的解决

这里我用的是http协议，请求的url也是http协议，这个位置测试网站换成https://blog.youkuaiyun.com/lovlu18 协议时，它还是可以得到响应，这个因为没有。通俗点来说，就是如果添加了UA之后，问题还没有得到解决，就看一下你请求的网站，是不是https,如果是，就改为http试一下，即建议大家使用。大多数网站都会对用户请求中的 User-Agent 进行检测，如果没有在请求头中设置 User-Agent，那么就会抛出异常。遇到这类的问题，在使用 Python 爬虫库中的。

2023-02-22 11:42:00 6753

原创 Scrapy中xpath与css的匹配不到内容的问题分析

用scrapy爬取某些数据的时候，发现用谷歌或火狐复制的xpath和css返回的数据总是空列表，确实令人费解。

2023-01-14 18:25:20 721 1

原创 SyntaxError: unexpected EOF while parsing解决方法

SyntaxError: unexpected EOF while parsing解决方法(遇到的问题）

2023-01-03 15:53:51 5146 2

weixin_73817187的博客