爬虫
文章平均质量分 58
独行者~
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
爬虫第八关--登陆发表评论
登陆发表评论理论知识post请求cookiessession存储cookies读取cookies最终代码理论知识post请求post请求的参数就不会直接显示,而是隐藏起来。像账号密码这种私密的信息,就应该用post的请求。如果用get请求的话,账号密码全部会显示在网址上。可以这么理解,get是明文显示,post是非明文显示。通常,get请求会应用于获取网页数据,比如我们之前学的requests.get()。post请求则应用于向网页提交数据,比如提交表单类型数据(像账号密码就是网页表单的数据)co原创 2021-03-07 15:23:15 · 651 阅读 · 0 评论 -
爬虫第六关----存储爬取的数据
存储数据理论知识csv写入与读取(引用csv模块)Excel写入与读取(引用openpyxl模块)代码实现这篇文章是上一篇的续集(爬虫第五关----狂热粉丝),即将爬取到的歌曲信息存储到Excel里面。理论知识csv写入与读取(引用csv模块)CSV写入步骤CSV读取步骤Excel写入与读取(引用openpyxl模块)代码实现...原创 2021-02-22 16:09:53 · 349 阅读 · 2 评论 -
爬取QQ音乐周杰伦歌曲的歌词
代码如下:import requestsimport json# 引用requests,json模块url = 'https://c.y.qq.com/soso/fcgi-bin/client_search_cp'headers = { 'origin':'https://y.qq.com', # 请求来源,本案例中其实是不需要加这个参数的,只是为了演示 'referer':'https://y.qq.com/n/yqq/song/004Z8Ihr0JIu5s.html原创 2021-02-19 16:57:05 · 847 阅读 · 0 评论 -
爬虫第五关----狂热粉丝
狂热粉丝理论知识带参数请求数据Request headers使用什么是Requests headers如何调用Requests headers分析网页信息的方法最终代码本文章仅作为学习风变编程爬虫课程的学习笔记,欢迎大家交流学习理论知识带参数请求数据每个url都由两部分组成。前半部分大多形如https://xx.xx.xxx/xxx/xxx,而后半部分,多形如:xx=xx&xx=xxx&xxxxx=xx&……两部分使用?来连接。以豆瓣网址为例,前半部分就是:https://原创 2021-02-18 15:24:40 · 661 阅读 · 2 评论 -
爬虫第四关——寻找周杰伦
寻找周杰伦初始Java开发Java编程起步JShell工具CLASSPATH 环境属性功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入本文章仅作为学习风变编程爬虫课程的学习笔记,欢迎大家交流学习初始Java开发Java编程起步原创 2021-02-16 16:28:21 · 507 阅读 · 0 评论
分享