
python
文章平均质量分 85
Shi.Zhen.
这个作者很懒,什么都没留下…
展开
-
python爬虫实践-B站弹幕分析
系列文章目录提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言目录主程序模块main()函数1.访问弹幕数据2.对弹幕数据进行解析3.保存到doc文件总结前言在前两次的晋江小说和腾讯弹幕爬取基础上,我逐渐觉得自己掌握了这门技术的奥义?于是迫不及待地又对准了我的下一个目标——B站。为什么是B站?作为弹幕文化的大本营,必须是B站,B站的大部分有趣都来自于弹幕。目录与前两个爬虫实践如出一辙,都是一个主函数作为程序入口,并调用子函数。其它几个def定义的原创 2021-10-19 21:22:56 · 3345 阅读 · 0 评论 -
python爬虫实践-腾讯视频弹幕分析
@[TOC]python爬取腾讯视频弹幕前言编写这个程序的出发点是……研究弹幕文化??额,不是,就是好奇,大家都发些什么,为什么有些弹幕反响很高,我每次发都无人问津(生气)那还是和上次爬取晋江小说的程序流程差不多,就是进入网页,提取数据,存储数据。不同的只是网页编排方式不一样,只要找到合适的正则表达式,就可以把数据提出来。哦,还有一个大问题,找到存储弹幕数据的文档规律最重要,这个解决了,基本这个程序就完成了。当然,为了方便我们的数据更有质量,可以用程序筛选一下,比如重复的弹幕就只记录一条,100个原创 2021-10-19 20:55:29 · 1468 阅读 · 2 评论 -
python爬虫实践--晋江小说书籍分析
python@ljr初心:寒假在家看小说,看着看着想自己写,然后申了几次没过,打算把榜单文章拿来好好分析一下,做个高大上的词云看看方向什么的。但我不会爬虫,只听说过,就上网搜别人的代码,但是别人的代码不满足我的需求,我看不懂也改不了。python爬虫实践凭着一口我也是程序人的志气(主要恰好学了python),自己去搜了怎么写爬虫,把视频看了一遍,过了下大概思路,然后看第二遍,注意一些细节,跟着一步一步地做自己的(主要是用他的思路和跟着写一点语句),最后就把晋江上我需要的数据搞出来了。(默默夸一句,b原创 2021-03-12 21:33:50 · 13464 阅读 · 13 评论