
Task
完成简单有趣的小任务
why_not_study
这个作者很懒,什么都没留下…
展开
-
【sublime】使用sublime3的查找替换功能获得html页面的所有新闻标题
一、任务既然想获得新闻标题,哪里的标题最多呢?当然是排行榜啦。我们选取的是网易新闻排行榜。我们的目标是获得所有的新闻标题。获取方法有哪几种呢?第一种,我们可以通过爬取页面HTML文档,用bs4库解析后再用正则表达式提取相关内容。此外,我们还可以使用支持正则表达式的文本编辑器的查找替换功能,将两个标题之间的内容删除,即可获得新闻标题内容。根据北邮陈光老师的课程,我们还可以使用某些浏览器插...原创 2020-04-09 18:06:44 · 289 阅读 · 0 评论 -
【python】【爬虫】爬取电子书《红星照耀中国》
一、任务拟爬取读典籍网站的《红星照耀中国》电子书。二、原理该网战没有反爬措施,HTML页面结构简单清晰,适合新手练手。(然鹅作者只是为了完成史纲课的阅读作业才决定爬这本书的……)如果有小伙伴对爬虫基本原理和方法还不清楚的,推荐北京理工大学《网络爬虫与信息提取》这门慕课 ~ 个人感觉讲的比较基础、系统、清晰 ~三、代码from bs4 import BeautifulSoupimpor...原创 2020-04-02 11:10:22 · 1490 阅读 · 0 评论 -
【python】【转调】用python程序实现简谱转调
一、任务用python实现将指定旋律从某调转到某调的功能。二、原理将X调转到Y调,即将X升(X-Y)个半音注:这里X-Y代表半音关系,对应下面的trans_map字典;注:传入的音阶应可以表示大于一个八度的音域。这里采用的策略是,若音符前面有.(点)则表示第一个八度,若在音符后面有.则表示高一个八度。三、代码#trans_map:定义音名间的半音关系,每个半音之间的差为1trans...原创 2020-03-16 00:06:34 · 2096 阅读 · 0 评论 -
【python】【爬虫】无反爬图片爬取
这是一个最简单的、没有任何针对反爬措施的爬虫。走错门的施主可以绕道了~~~一、问题受疫情影响,所有学校课程采用网课教学,各种课程群应运而生。想一次性找到所有课程群二维码,以供查询,怎么办呢?二、原理1、探明网页图片链接格式打开学校指定的查询课程二维码的网站,找到图片对应的http请求返回的图片链接,发现所有图片的链接都是http://xxx.cn/os/pic/+课程号-课序号+.jpg...原创 2020-03-01 15:57:47 · 495 阅读 · 0 评论 -
【Python】【排序】对list中的20个元素在一定条件下进行排序
一、问题1. 将20位同学随机分成五组,每组4人2. 且20位同学中有三位不会Python,不能分在同组3. 且20位同学中有8位女生,每组要求至少1名女生二、解决1. 随机排序问题1) 应用random包产生一组1~20的随机数,对应元素在list中的顺序import randomrank = random.sample(range(1,21),20)name = ["zhao...原创 2019-09-20 18:31:30 · 899 阅读 · 0 评论 -
【python】【kNN】【OCR】用python实现字符识别
一、问题OCR(光学字符识别)是机器学习重要的应用之一,一般要经过二值化、去噪、倾斜校正、特征抽取、字符切割、字符识别、后处理等过程。其中难度最大的是字符切割,最关键的步骤是字符识别。一般进行字符识别的方法有kNN,SVM,CNN等方式,其中比较好用的是SVM。作者在这里实现的是相对较为简单的kNN(k近邻)算法,用以完成经典的MNIST数据集的字符识别工作。该数据集的训练集共计60000条数据...原创 2019-09-29 20:27:24 · 1067 阅读 · 0 评论