- 博客(14)
- 收藏
- 关注
原创 【python爬取视频评论爬虫】一键获取视频下全部评论完整源代码
是中国知名的视频社区平台,以ACG(动画、漫画、游戏)内容起家,现已发展为涵盖多元文化的综合性视频网站。月活跃用户超3亿,日均使用时长约96分钟。拥有大量UP主(内容创作者),涵盖业余爱好者到专业机构。接下来我就介绍一下如爬取b站的某条视频下的全部评论。
2025-12-25 15:54:03
154
原创 【python爬虫微博评论】根据帖子链接批量爬微博评论,含二级评论
微博是国内极具影响力的社交媒体平台,具有内容形式短平快、热点事件实时性强、舆论快速发酵、用户群体年轻且活跃等特点。其中,微博评论区是用户公开表达观点的重要场域,可通过评论区的数据,实时追踪情绪倾向、挖掘公众诉求、捕捉热点趋势、构建群体画像、从而进行社会学和传播学的研究等。基于此,我用python开发了一个爬虫采集软件,下边详细介绍。
2025-12-24 22:00:40
129
原创 爬取当当网书籍信息实战学习,内附源代码(2026最新版)
3,一起学习交流,通过公中号 iFeng的小屋 获取,有其他定制需要可以详细交流学习。当当网作为国内领先的电商平台,我们今天对它进行数据爬取。在数字阅读和在线图书销售飞速发展的今天,图书数据成为。书名,价格,出版社,简介,作者,评论数,发布时间。1,运行前需更换最新cookie。2,本作者一直在维护代码,确保您能顺利运行!2,这个代码可以指定爬取多少条数。
2025-12-23 21:57:48
145
原创 【python微博帖子爬虫】2026最新!微博根据搜索关键词批量爬帖子,附源代码!
微博是国内非常流行的社交媒体平台,内容主要以文字和图片为主,在实时性和关注热度方面尤为突出。广大网友在微博平台大量输出自己的观点、看法,组成了一个活跃度极高的社区群体。每次热点事件爆发的时候,微博热搜也是所有媒体平台里最先曝光的平台。所以我用python进行了一个数据采集的脚本开发。1.2 数据截图微博帖子采集结果。
2025-12-22 18:36:11
159
原创 【爬虫实战】手把手教你爬取微博数据,轻松获取任意用户全部微博!
可立即运行的爬虫脚本,详细的配置教程(含Cookie获取方法)。Python副业星球共重号可以获取完整源码和详细配置教程!大家有需要可以我们一起交流一下哦,相互学习!
2025-11-22 23:46:21
1069
原创 Python执行js报错:UnicodeEncodeError: ‘gbk’ codec can‘t encode character “lxa9’ in position 69188()
最近在运行python执行js逆向时报错:UnicodeEncodeError: 'gbk’ codec can't encode character "lxa9’ in position 69188: illegal multibyte。下面我将讲述一些方法去彻底解决这个问题。以上三种方法均可解决这个问题。若你想获取更多干货或者学习的代码的话,可以找到公众号python副业星球,里边有很多干货内容,让我们一起学习成长。
2025-09-26 21:25:42
223
原创 解决报错:execjs._exceptions.ProgramError: SyntaxError:缺少字符串(完美解决!)
上次给一位客户打包环境的时候,客户的电脑报execjs._exceptions.ProgramError: SyntaxError:缺少字符串这个错,而我的电脑却没有任何问题,我还检查代码好几遍,始终没有解决。最后才发现是客户没有环境的问题。
2025-09-19 22:16:21
327
原创 【共重号爬虫采集软件】一键采集相关数据,功能强大!
本文介绍了一款Python开发的公众号文章批量下载工具,主要功能包括:支持关键词/反向关键词搜索、自定义日期范围爬取、选择性抓取文章内容、批量导入公众号等。工具可导出Excel格式数据,无需配置环境即可使用。
2025-08-23 17:42:25
209
原创 爬取b站弹幕数据,轻松获取用户真实反馈!附完整Python代码+解析
大家好,今天给大家分享一个如何爬取B站弹幕数据的完整教程。弹幕作为B站独特的文化现象,蕴含着大量用户真实反馈,对于数据分析、舆情监控或趣味研究都非常有价值。下面我将介绍如何使用Python获取B站弹幕数据,并保存到Excel文件中。话不多说,直接开干!以上就是全部内容啦,如果你感兴趣的话欢迎关注我,我还会写更多对大家有帮助的代码,欢迎大家交流学习。欢迎大家在公重微号找python副业星球!有很多实用的代码!下期再见!
2025-08-20 00:27:07
384
原创 Python爬虫实战:百度搜索数据抓取代码全解析(Selenium自动化,后附完整代码)
本文介绍了利用Python爬取百度搜索关于GPT-5数据的方法。该爬虫程序能自动翻页采集搜索结果,包含页码、标题、链接和简介等字段,适合用于数据分析。代码采用多种异常处理机制确保稳定性,适合Python爬虫学习者参考。
2025-08-09 16:53:58
775
原创 根据关键词抓取微博帖子python爬虫数据抓取保姆级步骤教程
本文介绍了使用Python爬取微博关键词相关数据的方法。通过requests和BeautifulSoup库实现爬取功能,包含用户信息、博文内容及互动数据(转发、评论、点赞)等字段的提取。文章详细讲解了请求头设置、时间范围限定、分页处理、长文本获取等关键步骤,并提供了异常处理和反爬策略。最终450+条数据通过pandas存储,完整代码可直接运行。
2025-08-06 16:24:02
1185
3
原创 http.client.RemoteDisconnected: Remote end closed connection without response相关问题的解决
这里我用的是http协议,请求的url也是http协议 ,这个位置测试网站换成https://blog.youkuaiyun.com/lovlu18 协议时,它还是可以得到响应,这个因为没有。通俗点来说,就是如果添加了UA之后,问题还没有得到解决,就看一下你请求的网站,是不是https,如果是,就改为http试一下,即建议大家使用。大多数网站都会对用户请求中的 User-Agent 进行检测,如果没有在请求头中设置 User-Agent,那么就会抛出异常。遇到这类的问题,在使用 Python 爬虫库中的。
2023-02-22 11:42:00
6753
原创 Scrapy中xpath与css的匹配不到内容的问题分析
用scrapy爬取某些数据的时候,发现用谷歌或火狐复制的xpath和css返回的数据总是空列表,确实令人费解。
2023-01-14 18:25:20
721
1
原创 SyntaxError: unexpected EOF while parsing解决方法
SyntaxError: unexpected EOF while parsing解决方法(遇到的问题)
2023-01-03 15:53:51
5146
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅