原文链接:http://zhentaoo.com/2017/10/22/Pupputeer2
看过上篇的同学,应该都会使用Puppeteer的高级爬虫功能了,附上姐妹篇链接:
爬取并生成《ES6标准入门》PDF–Puppeteer初探
除了爬虫之外,也可以使用Puppeteer完成页面上任意操作,即: 可以用来做UI自动化测试
开门见山,今天的目标是,爬取SF的热门文章,自动推荐到掘金!!!
简要提下Puppeteer的应用场景
- 屏幕快照,打印PDF
- 高级爬虫(有别于传统爬虫.使用Puppeteer可以拿到渲染后的效果,传统爬虫相当于只能拿到http response)
- UI自动化测试(使用Puppeteer可以模拟用户操作)
- 页面性能分析
废话不多说,直接上动图/视频看效果
GIF图片比较大,如果不能加载成功,也可以到微博看下录制的视频
http://weibo.com/tv/v/FiHMz7dcq?fid=1034:dcc08a8eee118263f6071fb6fafcc9a9

本文介绍了如何利用Puppeteer爬取SegmentFault的前30篇热门文章,并自动推荐到掘金平台。通过Puppeteer进行屏幕快照、高级爬虫、UI自动化测试和页面性能分析等操作,详细阐述了爬取和推荐的具体流程,包括登录、模拟用户操作等步骤。项目源代码已开源,可供进一步研究。
最低0.47元/天 解锁文章
1094

被折叠的 条评论
为什么被折叠?



