自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小董同学的博客

小董同学的学习笔记

  • 博客(17)
  • 收藏
  • 关注

原创 Python爬虫 | 斗图网表情包抓取

⚡有了它斗图从来没输过!⚡【进程池+线程池】一、前言二、环境准备三、具体实现1、url构造2、单线程3、进程池4、线程池5、成果四、最后完成目标:  分别使用单线程、进程池和线程池下载表情包,对比三者下载速速。一、前言  学了一段时间时间的爬虫,最近又学了进程池和线程池,能加速下载,今天就写这个程序来测试。二、环境准备编辑器:pycharm用到的库:requests、lxml、multiprocessing、concurrent三、具体实现1、url构造  观察网站url,页码是

2021-10-16 21:51:44 820 1

原创 Python爬虫 | 爬取高质量小姐姐照片

Python爬虫 | 批量爬取某图网站高质量小姐姐照片1、数据来源分析2、获取author_id_list和img_id3、代码实现3.1、制作detial3.2、制作detial_list3.3、数据保存3.4、批量获取4、完整代码声明1、数据来源分析  在网页HTML源代码里,我们找到了每一张照片的地址为https://photo.tuchong.com/5489136/f/360962642.jpg  解析如下https://photo.tuchong.com/author_id_l

2021-10-13 20:45:58 6132 14

原创 ⚡混沌世界中的醒与痴——醒哥与九妹⚡

⚡混沌世界中的醒与痴——醒哥与九妹⚡一、前言二、环境准备三、具体实现1、短评获取并保存2、词云制作3、主函数4、结果四、最后完成目标:  使用协程对网站进行抓,加快执行效率,提取评论,制作词云。一、前言  《巾帼枭雄之义海豪情》是《巾帼枭雄》是姐妹篇。  该剧为TVB四十三周年台庆剧,也是2010年节目巡礼剧集之一。  故事以三十年代的广州为背景。郑九妹(邓萃雯 饰)是广州最大黑道势力的郑朗军(岳华 饰)的大女儿,打理家族鸦片生意。局势动荡,日军大举侵华,大佐向山铁也(金刚 饰)利用鸦片生意

2021-09-12 09:33:58 804 34

原创 ⚡一文告诉你蓬莱阁到底如何⚡

⚡一文告诉你蓬莱阁到底如何⚡一、前言二、环境准备三、具体实现1、短评游客评论并保存2、词云制作3、成果四、最后完成目标:  获取评论并制作词云一、前言  毕竟会在烟台待上三年,先了解了解烟台这个地方。二、环境准备编辑器:pycharm用到的库:requests、wordcloud、jieba三、具体实现1、短评游客评论并保存  爬取去哪儿网关于蓬莱岛的游客评论的前20页def save_comment(): fp = open("comment.txt", mode="

2021-09-07 08:30:22 5589 29

原创 ⚡几行代码测出你的颜值有度高!!!⚡

⚡几行代码测出你的颜值有度高!!!⚡一、前言二、环境准备三、具体实现1、安装百度AI的库2、新建AipFace3、接口说明4、返回数据5、定义函数6、图片爬取函数7、主函数8、成果四、最后完成目标:  利用百度AI接口,对照片进行颜值评分。一、前言  想必很多人都对自己的颜值到底怎样充满好奇,也有很多软件为大家提供了颜值打分的趣味功能。今天就利用百度的平台对人脸进行颜值检测,其平台已经准确识别多种人脸属性信息,包括年龄、性别、颜值、表情、情绪、口罩、脸型、头部姿态、是否闭眼、是否配戴眼镜、人脸质

2021-09-05 08:48:24 972 16

原创 ⚡王者农药皮肤图片获取!⚡

标题一、前言二、环境准备三、具体实现1、所有英雄信息获取2、分析图片url3、具体实现4、结果四、最后完成目标:  获取王者官网英雄介绍页面高清图片一、前言  王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了。我们今天的重点是爬取王者荣耀所有英雄的所有皮肤!二、环境准备编辑器:pycharm用到的库:requests、lxml三、具体实现1、所有英雄信息获取  打开官网,进入英雄资料页面,通过开发者工具,得到所有的英雄的数据  每一

2021-09-01 20:56:40 6503 17

原创 ⚡萨 日 朗!!!⚡【弹幕爬取+词云】

⚡萨 日 朗!!!⚡【弹幕爬取+词云】一、前言二、环境准备三、具体实现1、封装请求函数2、获取cid3、获取弹幕4、保存弹幕5、制作词云6、主程序7、成果四、最后完成目标:  对B站视频⚡萨 日 朗!!!⚡【作者:雨夜繁星y】的弹幕进行获取,并制作词云。一、前言  华强受邀演唱萨日朗,每日一遍,日常生异形.原曲:火红的萨日朗——要不要买菜(DJ8先生)原唱:乌兰托娅二、环境准备编辑器:pycharm用到的库:re、requests、lxml、numpy、wordcloud、jieba

2021-08-28 16:36:21 1001 15

原创 ⚡豆瓣告诉你《扫黑风暴》如何【短评爬取+词云】 ⚡

豆瓣告诉你《扫黑风暴》如何【短评爬取+词云】一、前言二、环境准备三、具体实现1.短评获取并保存2.词云制作3 成果最后完成目标:  使用爬虫对电视剧《扫黑风暴》的豆瓣评论进行抓取,并对制作词云。一、前言  最近一部《扫黑风暴》可谓是掀起来了一波追剧狂潮,讲述了中央扫黑除恶督导组进驻中江省绿藤市,将黑恶势力及保护伞成功抓获的故事。  全员演技在线,故事悬疑,均根据真实案件改编,惊悚又令人上头!今天我们就通过抓取豆瓣最近的短评,进行词云分析看看观众们对这部电视剧的评价究竟如何?二、环境准备编

2021-08-27 18:55:44 1393 13

原创 手刃豆瓣top250排行榜

手刃豆瓣top250排行榜一、概述二、代码流程1、页面获取2、数据获取3、数据保存4、主程序5、结果四、总结一、概述 豆瓣是我挺喜欢的一个网站,因为有时候书荒了,或者想看电影了,我都会去豆瓣瞅一瞅,有哪些评分高的书籍和电影。当然喜欢它还有另外一个原因,那就是豆瓣可是新手练习爬虫的必爬网站啊!所以今天的目标也是豆瓣,要爬取的则就是豆瓣电影的top250。 功能说明:将电影的序号、电影名、电影链接、评分、评价人数、概况保存下来。二、代码流程1、页面获取# 定义一个函数来获取每次请求到的页面

2021-08-21 17:26:41 471 7

原创 爬虫之爬取猫咪图片(2.0版)

爬取猫咪图片2.0一、目标网站二、说明三、代码流程1~3与1.0版本一样4、GUI设计4.1 导入Tkinter库4.1 界面设计5、弹窗提示6、打包可执行文件四、完整代码上次一篇文章得到了大佬们的指点,提出了改进意见,十分感谢!一、目标网站本次爬取的网站是placekitten:http://placekitten.com/A quick and simple service for getting pictures of kittens for use as placeholders in

2021-08-11 22:16:42 1468 6

原创 爬虫之爬取猫咪图片(1.0版)

爬取猫咪图片一、目标网站二、说明三、代码流程1、获取url2、数据获取3、数据保存四、完整代码一、目标网站本次爬取的网站是placekitten:http://placekitten.com/A quick and simple service for getting pictures of kittens for use as placeholders in your designs or code. Just put your image size (width & height) af

2021-08-09 22:18:16 764 4

原创 快速入门python机器学习-3

二、特征工程-2 2.2 特征工程介绍2.2.1 为什么需要特征工程2.2.2 什么是特征工程2.2.3 特征工程的位置与数据处理的比较特征工程包含内容2.3 特征抽取2.3.1 特征抽取1 将任意数据转换为机器学习的数字特征2 特征提取API2.3.2 字典特征抽取:类别 -> one-hot编码1 应用2 流程分析2.3.3 文本特征抽取1 应用2 流程分析3 jieba分词处理5 Tf-idf文本特征提取5.1 公式5.2 API6 Tf-idf的重要性2.2 特征工程介绍2.2.1 为什么

2021-08-05 22:08:30 776

原创 快速入门python机器学习-2

二、特征工程 2.1-数据集2.1.1 可用数据集1 scikit-learn工具介绍2 安装3 scikit-learn包含的东西2.1.2 sklearn数据集1 scikit-learn数据集API介绍2 scikit-learn小数据集3 sklearn大数据集4 sklearn 数据集的使用2.1.3 数据集的划分数据划分API2.2 特征工程介绍2.3 特征抽取2.4 特特征预处理2.5 特征降维2.6 主成分分析2.7 总结2.1-数据集2.1.1 可用数据集kaggele网站:http

2021-08-05 22:03:14 507

原创 C语言编程入门之刷题篇-2

C语言编程第2讲BC6-小飞机BC8-十六进制转十进制BC9-printf函数的返回值BC11-学生基本信息输入输出BC35-判断字母BC12-字符金字塔BC13-ASCII码BC14-出生日期输入输出BC29-2的n次方计算BC15-按照格式输入并交换输出BC16-字符转ASCII码BC17-计算表达式的值BC18 计算带余除法BC6-小飞机描述:KiKi学会了printf在屏幕输出信息,他想输出一架小飞机。请帮他编写程序输出这架小飞机。输入描述:无输出描述: **

2021-08-03 22:22:28 509 1

原创 C语言编程入门之刷题篇-1

C语言编程第1讲BC01-实践出真知BC02-我是大VBC03-有容乃大BC07-缩短二进制BC19-反向输出四位数BC28-大小写转换BC01-实践出真知描述于老师经常告诉我们“学习编程最好的办法就是上机实践,因为你要对计算机下指令,想让计算机帮你干活,就得多和计算机‘交流’,实践才能出真知。”输入描述:无输出描述:Practice makes perfect!#include<stdio.h>int main(){ printf("Practice mak

2021-08-03 22:05:37 671 1

原创 Numpy&Pandas(byMorvan)-numpy

Numpy一、Numpy1 概述1.1 numpy&pandas有什么用1.2 numpy&pandas安装2 基本操作2.1 numpy 属性2.2 numpy 创建array2.3 numpy 基础运算12.4 numpy 基础运算22.5 numpy 索引2.6 numpy array合并2.7 numpy array分割2.8 numpy copy&deep copy一、Numpy1 概述1.1 numpy&pandas有什么用1.2 numpy&pa

2021-08-03 21:31:47 149 1

原创 快速入门python机器学习-1

01-机器学习概述 1.1-人工智能概述1.2-什么是机器学习1.3-机器学习算法分类1.4-机器学习开发流程1.5-学习了框架和资料介绍1.1-人工智能概述1.2-什么是机器学习1.3-机器学习算法分类1.4-机器学习开发流程1.5-学习了框架和资料介绍...

2021-08-03 13:12:31 409

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除