
python
文章平均质量分 70
小浪浪、
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据科学导论——数据可视化进阶
第1关:热图 请仔细阅读右侧代码,结合相关知识,在 Begin-End 区域内进行代码补充,在上图示例中计算属性之间的相关性。 具体绘图请按照以下要求可视化: 数据文件路径为 Task1/listings.csv; 图形的 figsize 为 (10, 10); 文件名为 Task1/img/T1.png。 import matplotlib matplotlib.use("Agg") import matplotlib.pyplot as plt import seab原创 2022-03-30 16:42:43 · 3618 阅读 · 2 评论 -
Python 爬取与反爬取进阶
目录 任务描述 相关知识 编程要求 测试说明 任务描述 本关任务:使用随机请求头爬取 www.qiushibaike.com/text/ 前两页的段子内容,并保存在 ./step4/content.txt 中。 相关知识 在反爬机制中,许多网站会通过 ip 以及请求头来限制你的访问,在不影响网站正常运作的情况下,我们可以使用 ip 代理池以及随机请求头来伪装自己的爬虫,其中需要用到的就是 python 的 random 模块。 编程要求 请仔细阅读右侧代码,结合相关知识,在 Be原创 2022-03-30 10:32:24 · 2173 阅读 · 0 评论 -
Python 爬取与反爬取
目录 任务描述 相关知识 编程要求 测试说明 任务描述 本关任务:编写一个爬虫,实现对 知乎 - 有问题,就会有答案 该网址所有信息的爬取,并将结果保存在 step3/result.txt 中。 相关知识 随着网络爬虫对目标网站访问频率的加大,网站也会禁止爬虫程序访问。 常见反爬手段: 出现用户登录界面,需要验证码; 禁止某个固定用户帐号或 ip 一段时间内访问网站; 直接返回错误的无用数据。 应对措施: 优化爬虫程序,尽量减少访问次数,尽量不抓原创 2022-03-30 10:29:53 · 716 阅读 · 0 评论 -
Python 单网页爬取
目录 任务描述 相关知识 网络爬虫 网络爬虫:载入 网络爬虫:动态载入 网络爬虫:解析 编程要求 测试说明 任务描述 本关任务:编写一个爬虫,爬取 www.jd.com 网的 title。 相关知识 为了完成本关任务,需要具备几个基本的技能。首先需要对 Python 语言具有一定的掌握。了解其中的 Urllib 库, Re 库, Random 库。其中,Urllib 库主要实现对网页的爬取。Re 库实现数据的正则化表达。Random 库实现数据的随机生成。 网络爬虫是一种按照一原创 2022-03-29 10:54:04 · 3331 阅读 · 0 评论 -
Python流程控制
7-1 春夏秋冬 (10 分) 气象意义上,通常以阳历3~5月为春季(spring),6~8月为夏季(summer),9~11月为秋季(autumn),12月~来年2月为冬季(winter)。请根据输入公历的年份以及月份,输出对应的季节。 输入格式: 输入的数据格式是固定的YYYYMM的形式,即:年份占4个数位,月份占2个数位,且没有不合理的输入,如2017!@#$%13^&*之类的形式。 输出格式: 输出月份对应的季节(用英文单词表示,全部用小写字母)。 样例1">输入样例1:原创 2022-03-23 19:53:59 · 4720 阅读 · 0 评论 -
Python基本数据类型
7-1 输入姓名,问好,字符切片 (5 分) 从键盘输入姓名,对姓和名切片,然后输出 输入格式: 从键盘输入姓名, 输出格式: 你好,***同学。 *同学,很高兴认识你。 **同学,我们交个朋友吧! 输入样例: 在这里给出一组输入。例如: 黄小燕 输出样例: 在这里给出相应的输出。例如: 你好,黄小燕同学。 黄同学,很高兴认识你。 小燕同学,我们交个朋友吧! name = input() print("你好,"+name+"同学。") print(name[0]+"同学,很高原创 2022-03-23 19:45:15 · 5027 阅读 · 0 评论