爬虫基础
文章平均质量分 53
主要介绍基础爬虫
互动创客坊
主要研究websocket逆向、弹幕互动技术
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Base64编码与解码
在逆向过程中,经常会遇到base64编码的数据,那就来了解一下base64的特点吧!1. Base64编码后的字符串长度通常是**4**的倍数2. Base64编码只包含以下字符:**A-Z、a-z、0-9、+、/、=**。3. Base64编码通常以一个或两个**等号结尾**(用作填充)原创 2023-10-07 10:58:52 · 1547 阅读 · 0 评论 -
Python爬取猫眼电影榜单评分,以及评论
猫眼电影评论爬取【目标】(1)爬取榜单电影名称以及评分,简单的数据可视化。(2)爬取《 你好,李焕英》的评论,用词云显示第一步:了解反爬机制:请求过多,ip地址会被封掉24h。User-Agent要频繁更换第二步:如何避免反爬:使用虚拟ip(网站:https://h.shenlongip.com/index/index.html,注册可领取500ip)。引入fake-useragent,配合random函数。第三步:确定URL地址(1)猫眼榜单URL:https://maoyan原创 2021-03-11 16:49:12 · 5294 阅读 · 0 评论 -
爬取简单静态网站——汽车之家二手车
简单静态一级页面爬取爬取汽车之家(泰州)二手车信息爬取[‘名称’,‘公里数’,‘上牌时间’,‘销售者’,‘价格’]————————开始了—————————1.判断是否为静态页面图中的文字信息出现在源代码中,可以判断为静态页面。2.分析网址#第一页地址:https://www.che168.com/tai_zhou/a0_0msdgscncgpi1lto1cspexx0/#第二页地址:https://www.che168.com/tai_zhou/a0_0msdgscncgpi1lt原创 2021-03-05 22:20:40 · 2718 阅读 · 29 评论
分享