- 博客(11)
- 收藏
- 关注
原创 TikTok爬取——视频、元数据、一级评论
本文介绍了一个TikTok爬虫程序,采用拟人化策略自动抓取视频数据。程序将每个视频及其元数据、评论分别存储为独立文件夹,包含三个文件:视频文件、元数据CSV(含用户名、标题、点赞数等6项数据)和一级评论CSV。核心功能包括:通过Selenium模拟用户操作,自动提取视频元数据,抓取并存储评论内容(支持滚动加载),以及自动翻页功能。程序设定了最大抓取视频数量(默认300个),采用调试模式连接Chrome浏览器,确保操作更接近真实用户行为绕过反爬机制。
2025-11-25 11:24:22
307
原创 Novel-to-Script:基于深度学习的小说剧本转换器
Novel-to-Script:基于深度学习的小说剧本转换器。笔者开发一种主要基于LLM(Deepseek API)的转换器(小说转剧本),辅助BERT情绪分析,Seq2Seq动作分析;笔者与协助者从数据爬取到模型转换,一体化流程(仍只有后端),再到最后的剧本生成word一体化框架,并提供完整代码在GitHub上。
2025-05-14 17:33:37
2184
原创 更多 LSTM 变种——应用于 CMAPSS 数据集
本文并模型介绍,只是把一些比较火的技术,像双向注意力机制,自注意力机制这样的比较火的内容,简单的和LSTM堆叠,结果发现效果都不如最基础的,这里作者将本人代码及实现结果,进行展示,给各位想更改LSTM的朋友一些。
2025-03-10 09:00:00
1541
原创 图像增强任务——基于CycleGAN与UNet分别实现与对比
本文通过两种方法CycleGAN与UNet来实现计算机视觉领域的增强任务,并提供一些个人见解
2025-02-27 13:50:18
1955
原创 白鲸优化算法解读及优化
事先声明,本人为在读大学生,并非专业人士,因此对白鲸优化算法的解读更趋近于个人理解,而不是学术理解,至于优化,是本人在一次竞赛时想到的点子,。下面是我在一次竞赛适用的多目标白鲸优化算法的代码。
2024-06-18 14:37:27
1729
1
原创 拟人化爬虫——通过图片提取文字技术实现
事先声明的是,我只是个普普通通的在读大学计算机学生,这篇文章并不是专业文章,但我之前在学习计算机的过程中,互联网上有很多计算机的前辈在csdn,知乎,git上分享的文章的帮助,这种开源精神是互利共赢的,我也希望我能为其他人做出一点贡献,虽然不专业,但也可以为其他人节省一些时间,代码我会附录在结尾,。
2024-06-18 13:47:53
1810
1
新浪微博财经新闻数据集(格式为 时间,转发数,评论数,点赞数,内容)
2025-05-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅