- 博客(7)
- 收藏
- 关注
原创 Python语言一键整理xhs评论 基于github的开源项目 MediaCrawler
通过简单的调整和部署,博主成功利用Python和MediaCrawler工具整理了xhs的评论数据。即使对于Python的掌握程度仅限于基础,通过开源项目和调试代码,依然可以在短时间内实现自己的需求。博主的PC系统是Windows,已经提前部署好了Anaconda、Python等开发环境,并安装了Pycharm。虽然博主对Python知识仅有一些基础了解,但在几个小时内成功实现了一键整理xhs特定帖子的评论。在本地项目文件夹中,博主进入到项目的根目录,并根据需要对关键代码文件进行了一些调整。
2025-08-16 15:35:37
671
原创 使用github开源项目MediaCrawler爬取XHS评论 (1) 环境部署
Node.js 的下载地址为 https://nodejs.org/zh-cn/download/ ,安装时建议路径不含中文。安装后配置环境变量,在系统变量 Path 中添加 nodejs 安装路径,最终可在 cmd 或终端查看 node 和 npm 版本。为了更好地处理具有恶意的言论,博主拟对自己账号下笔记的评论进行爬取。这次爬虫,前期部署,用到的工具是Powershell/cmd。昨天晚上,看到了一个开源的工具,叫MediaCrawler。周五,在优快云上琢磨了一天,也没琢磨出来。
2025-08-16 14:23:08
482
原创 小红书帖子评论的nodejs爬虫脚本
从小红书上爬取评论,但是目前还不能完全爬取子评论,使用GPT没能解决这个问题。需要安装nodejs软件,部署环境变量。博主是在pycharm中运行的。后续博主可能会改进。或者如果你懂的话,可以在博主代码基础上改进。自行修改参数(中文在代码里标记了)即可。
2025-08-15 22:50:24
253
原创 知道车辆信息,免费百度查询车辆品牌的方法
在百度上搜索发动机号码,即可找到该车辆为奔驰品牌。在交通事故认定书上,上面有机动车的发动机编号。其他渠道查询,多少要花钱。我这个方法完全免费。忘记了这个车辆的品牌,但是认定书上没有写。2022年父亲出了车祸。
2024-07-18 01:52:26
497
原创 知乎爬取评论(不是回答)的Python代码,无套路,完全免费获取。
安装Python/Anaconda,以及Python的IDE,Pycharm是用的最多的Python。爬虫需要你自己粘贴替换cursor信息,cookie缓存信息,以及问题的编码。将我的代码从网站上复制到你的Python IDE里。学Python 3天也够了,至少可以爬取知乎的回答和评论了。阅读本教程之前,请你确定你还能进入你想阅读的问题。找到你想爬取评论的问题,并在问题中定位问题的编号。然后,你在里面搜你的ID,就可以看到你的评论了。在py所在的文件夹的地址栏输入cmd,回车,cookie缓存信息,
2024-07-11 20:20:14
2045
4
转载 微信聊天记录迁移/备份的传输速度慢(加速微信数据备份速度)的解决办法
微信聊天记录迁移/备份的传输速度慢(加速微信数据备份速度)的解决办法
2024-06-19 20:42:11
28714
14
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人