声明:文章内容仅供学习参考使用,请勿做任何商业行为等非法用途。
目标:获取小红书某条笔记的文章内容
目前已经学习到并解决的(应该是最菜的思路了吧,毕竟刚刚开始学习):
1.采取的使用爬虫的基本对网页进行扫描,获取出来信息后对网页进行解析。
完全能够获取到笔记的标题,详情,以及话题,等等等,只要页面能看到的就能获取到。
2.发现点赞量等等和数据相关的数据超过10个都会显示10+
传入登录信息可以获取到具体的数据
3.操作次数过多会出现系统繁忙,增加ip代理
可以完美的规避系统繁忙问题,不会经常提示繁忙
没有解决的
发现经常出现滑块验证(不过滑动一下还是可以解决的),不知道有么有大佬解决的
获取博主下面的笔记内容还在探索中…
欢迎各位大佬留言,和提供解决思路。