- 博客(45)
- 资源 (31)
- 收藏
- 关注
原创 度娘程序猿心中的美女是什么样子?运行本程序测试下便知
在工作目录中新建子目录(如zkk),存入若干张清晰的人物照片,运行本程序,能打印出每张照片性别、年龄、漂亮程度、是否带眼镜等。扩展功能,本地或网上多人合影照片也能测出性别、颜值等from aip import AipFaceimport base64,os, mathpath = r'zkk'""" 你的 APPID AK SK &
2019-01-23 10:36:27
871
原创 使用百度云接口API和人脸库完成本地合影图片的多人脸识别--V3版接口Python语言
1.准备工作1.1 构建使用环境Windows x、python3.x1.2 申请百度人脸识别API服务注册并登录百度帐号,在产品中找到“”人脸识别”产品,点击“立即使用”,然后创建一个应用。我已创建获取三个参数:APPID、API Key、Secret Key1.3 安装baidu的aip库 pip install baidu-aip1.4 重要的区块代码""" 你的 A...
2019-01-17 08:00:13
2243
原创 python--合影照片中多人脸检测、分离、存储、识别综合应用
一时对人脸识别发生了兴趣,这几天踩了不少坑,主要坑是在dlib的安装和参考网上代码时遇到或多或少代码错误。网上关于人脸检测、识别的代码很多,我采用了其中之一的方法,并综合应用,适合初学者入门学习,欢迎交流。应用环境:window 7 、python3.5shape_predictor_68_face_landmarks.dat 需在网上下载dlib_face_recogniti...
2019-01-15 22:55:42
2797
1
原创 用Python跳帧截取视频帧
可以自由设定时长来截取视频,经实测效果理想。期间遇到的一个麻烦是我的视频文件在D:盘,在原视频D盘目录上不能保存截取的图片文件,后改为在C:盘上保存,正常。具体原因不明,有网友知道原因所在,请告知。import cv2import osdef save_img(): video_path =r'读入视频路径' videos = os.listdir(video_path)...
2019-01-14 18:56:18
1976
1
原创 用Python爬取豆瓣首页所有电影名称、每部电影影评及生成词云
1.爬取环境:window 7Chrome 浏览器注册豆瓣、注册超级鹰2.安装第三方库:安装第三方库:主程序用到的库有import sys, timeimport pytesseractfrom selenium import webdriverfrom PIL import Image, ImageEnhancefrom chaojiying import Chaoji...
2018-12-24 17:19:32
2783
1
原创 《我不是药神》影评,逐页评论自动生成词云
注意事项:生成词云的图片必须是黑色照片豆瓣不登录用户只能访问到影评的前12页的数据豆瓣影评数据只展示24页本方法是上一篇博客的另一种写法爬取豆瓣的全部内容目前还不太容易,真正可行的我还没见到,希望各位大侠能真正的爬出来分享。import requestsfrom bs4 import BeautifulSoupimport timeimport jiebafrom wor...
2018-12-21 08:38:03
681
1
原创 爬取豆瓣电影,输出最新电影列表、影评、影评热词统计、词云之一
1.写爬虫博客的背景这两天对机器学习产生了兴趣,学习中有网友问我爬取豆瓣影评的问题,并且说在百度上搜的完整代码都不能运行。我好奇也在优快云上搜了几个类似的完整代码,的确不能运行。我对不能运行的代码进行了分析,至少有以下几种情况:1 作者发布的代码本身有问题,抄转的多;2 爬和反爬是矛和盾的关系,时过境迁、headers、cookies不一样也会爬不成功;3 爬虫对初学者是个费时劳神的活,很多坑...
2018-12-20 00:39:17
2264
原创 如何安装Python的第三方库mlpy?
在机器学习安装mypl库时,按照百度出来的方法尝试,遇到了各种坑,有的是版本不匹配;有的是下载解压成.exe可执行文件,可能是安装路径问题,均不能正常安装.经本人摸索实验,以下效果简单方便,值得推荐给网友.
2018-12-14 16:46:57
2040
3
原创 用Python实现连续图文识别
1.工具:1.1 剪切板。我下载并安装使用的是剪切板查看器(clipbrd.exe),成功后显示“剪贴薄查看器.exe”1.2 截图工具并设置热键。保存图片键和退出键可任意设置,注意不能同其它热键冲突。我使用的是微信截图,进入设置---进入快捷按键---把截取屏幕键改为F1。1.3 Python 3.x,Windows环境1.4 注册百度云帐号,获取Appid API Key ...
2018-12-12 21:59:08
1278
2
转载 微信公众号如何把历史记录设置到自定义菜单中
创建于2018-03-09 21:56现在很多朋友都使用微信公众号来发布消息,但是在使用微信公众平台编辑内容的时候会发现一个问题,新订阅者关注微信公众号以后,在界面上只能看到从订阅以后作者发布的消息,订阅以前作者发布的文章很难被找到,为了方便订阅者阅读历史记录,下面就教大家如何在自定义菜单中设置出历史记录(往期精彩)这个菜单大类,实现点击直接跳转的功能。方法1 首先,登录微信公...
2018-12-10 14:16:58
2126
原创 用Python采集微信公众号文章
在python一个子目录里存2个文件,分别是:采集公众号文章.py和config.py。 代码如下:1.采集公众号文章.pyfrom urllib.parse import urlencodeimport pymongoimport requestsfrom lxml.etree import XMLSyntaxErrorfrom requests.exceptions impo...
2018-12-10 13:06:59
1440
1
原创 使用python的“ ==” 和“ is”容易出错的环节
在python中,正确使用==与is ,需要清楚二者之间的区别和联系,以及适用范围。1.应用于数值型的数据(如整数):== 是用来比较 a 和 b指向的内存地址中的值是否相等,相等就是True,不相等就是False;" is" 是用来比较 a 和 b 是否指向同一个内存地址,相同就是True,不相同就是False,但适用范围是【-5,256】间的整数。超出此范围的同一整数用”is”比较,结果...
2018-12-06 14:04:09
442
原创 批量升级Python 3.x下第三方库的方法
Python有丰富的第三方库资源,并且更新速度也很快。逐一更新费时费力。本人在Windows下摸索出批量更新库的小技巧,供参考。
2018-12-03 12:40:56
1896
转载 一道很有意思的今日头条面试题
今天和大家分享的是身边同学在今日头条二面期间遇到的一道很有意思的面试题,面试题目大概如下:5个人去一个海岛寻宝,最后一共找到了100枚金币。他们约定了一个分配方案,如下:五个海盗按照抽签的顺序依次提出方案,某一个人提出方案之后,剩余存活的人投票表决:方案需要获得超过半数人的认可之后才能被通过,否则方案提出者将会被扔进大海喂鲨鱼,某一个方案被通过后游戏就结束。注:每个人的投票都是在追求自己利益的...
2018-12-01 14:51:28
1967
原创 编程老白参加Python首次等级考试试水成功!
Python于2018年9月首次纳入全国计算机二级考试,虽然年初大纲已公布,但应考的教材7月底才出来,又加上没有现成的试题库。对于我这个年龄偏大(已过56岁)、又无编程基础的老白(94年考过全国计算机二级后,24年没有接触过编程),如果不认真的备考,过级不会轻松的。幸运的是,我顺利的通过了。现分享下自学备考的经验:一、紧扣大纲自习。在教材未出来之前,我按照大纲的要求,查漏补缺,没有学过的内容,补...
2018-11-21 13:31:54
10336
3
转载 pip和easy_install使用方式
pip和easy_install使用方式转载 2013年12月03日 16:03:3431574easy_install 跟 pip 都是 Python 的套件管理程式,有了它們,在使用 Python 開發程式的時候會帶來不少方便。easy_install 和 pip 有什麼不一樣?據 pip 官網的說法,pip 改善了不少 easy_install 的缺點,如此說來 pip 應該是略勝一籌,不過...
2018-04-19 05:49:04
610
转载 Python datetime模块详解、示例
目录(?)[+]一、datetime模块介绍(一)、datetime模块中包含如下类:类名功能说明date日期对象,常用的属性有year, month, daytime时间对象datetime日期时间对象,常用的属性有hour, minute, second, microseconddatetime_CAPI日期时间对象C语言接口timedelta时间间隔,即两个时间点之间的长度tzinfo时区信...
2018-04-19 05:39:39
319
转载 爬虫之登陆验证
原创 2016年11月25日 10:49:55标签:selenium /登陆验证 /cookie /phantomjs /爬虫14147运行爬虫抓取某些网站的时候,经常会碰到需要登陆验证(输入账号、密码)之后才能获取数据的情况。那么问题来了,如何完成登陆验证呢?下面以itunes为例大概总结两种方法。主要使用工具为python/java、selenium、phantomjs或firefox/chr...
2018-04-14 01:00:00
4715
转载 python爬虫常用库之BeautifulSoup详解
有人说,正则很难,学不好。正则的确很难,有人说过:如果一个问题用正则解决,那么就变成了两个问题。所以说学不会是很正常的,不怕,除了正则,我们还可以用另外一个强大的库来解析html。所以,今天的主题就是来学习这个强大的库--BeautifulSoup,不过正则还是需要多多练习下的。因为是第三方库所以我们需要下载,在命令行敲下以下代码进行下载pip installim安装第三方解析库pip...
2018-04-12 08:54:19
867
转载 win10下Python3.6安装、配置以及pip安装包教程
1.前言之前在电脑上安装了python3.6.2(目前是最新版),可以看到,是2017-07-17才出的。因此,我发现有三个重要的包:Scrapy、PyQt和TensorFlow都还没有适配python3.6.2版本。无奈之下,只能卸载python3.6.2,安装稍微老一点的python3.6.1。另附Windows下python下载地址2.安装python安装python的过程比较傻瓜化,注意三...
2018-04-11 19:12:47
9197
转载 Scrapy简单入门及实例讲解
Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 其可以应用在数据挖掘,信息处理或存储历史数据等一系列的程序中。其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的, 也可以应用在获取API所返回的数据(例如 Amazon Associates Web Services ) 或者通用的网络爬虫。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。Scrapy 使用了...
2018-04-11 16:38:22
239
原创 Python——pip安装报错:is not a supported wheel on this platform
pip安装报错:is not a supported wheel on this platform可能的原因1:安装的不是对应python版本的库,下载的库名中cp35代表python3.5,其它同理。可能的原因2:这个是我遇到的情况(下载的是对应版本的库,然后仍然提示不支持当前平台)我下载到的Twisted库文件名:Twisted-17.5.0-cp35-cp35m-win_amd64.whl使...
2018-04-11 16:05:10
830
1
原创 爬取豆瓣电影尝试
利用python爬取豆瓣电影,在学习了python基础后,一心想着快速入门爬虫,现找了个豆瓣电影来练手。1.找到网页并分析网页结构首先进入豆瓣电影Top250这个网页,按下f12打开开发者工具,如下图1802039651.png然后开始分析网页,点击开发者工具左上角的有个箭头的东西去找你
2018-04-08 07:30:02
604
转载 Requests调用基本方法
1、慨述1.1、实例引入# 引入Requests库import requests# 发起GET请求response = requests.get('https://www.baidu.com/')# 查看响应类型 requests.models.Responseprint(type(response))# 输出状态码print(response.status_code)# 输出响应内容类型 tex...
2018-04-07 23:20:28
599
原创 用谷歌浏览器 查看http头
使用chrome浏览器自带的开发者工具查看http头的方法1.用chrome浏览器打开网页, 在网页任意位置,按鼠标右键,将光标移到检查项,再按检查,打开了chrome自带的调试工具;2.按network标签, 刷新网页;3.刷新后,光标在在chrome自带的调试工具左边移动,找到你想爬的网页url(url跟随光标显示),点击鼠标左键,就会在调试工具的右边看到当前网页的http头了;请...
2018-04-07 20:48:18
1573
转载 python资料汇总
整理汇总Python,内容包括长期必备、入门教程、练手项目、学习视频。一、长期必备。1. StackOverflow,是疑难解答、bug排除必备网站,任何编程问题请第一时间到此网站查找。2. github,是源码学习、版本控制不可缺少的网站,找源码学习请第一时间到此网站,fork之后自己维护。在这里还是要推荐下我自己建的Python开发学习群:483546416,群里都是学Python开发的,如果...
2018-04-07 20:21:03
474
转载 谷歌、火狐、Safari开发工具使用方法
目录一、谷歌浏览器chrom二、火狐浏览器FireFox三、Safari浏览器 前言 在阅读下面内容之前,那么些简单的了解浏览器开发者工具到底是什么东西,到底有什么用途。浏览器开发者工具到底是什么? 其实简单的说,浏览器开发者工具就是给专业的web应用和网站开发人员使用的工具,当然只要你有兴趣想要了解,只要你对这个世界充满这好奇,什么东西你都可以了解。开发者工具到底有什么用...
2018-04-06 21:51:03
1791
转载 Python:爬取小说并写入txt文件
文章介绍了如何从网站中爬取小说并写入txt文件中,实现了单章节写取,整本写取,多线程多本写取。爬虫使用的python版本为python3,有些系统使用python指令运行本脚本,可能出现错误,此时可以试一试使用python3运行本脚本。 本文是一个教程,一步步介绍了如何爬取批量小说内容以及存储这是txt文件中,以下是项目源码地址。 爬虫源码地址:https://git.osc...
2018-04-06 21:28:51
3096
转载 HTML <table> 标签
HTML <table> 标签实例一个简单的 HTML 表格,包含两列两行:<table border="1"><tr><th>Month</th><th>Savings</th></tr><tr><td>Jan
2018-04-06 17:47:39
237
转载 TML+CSS基础代码 table中的tr中的td标签中的valign属性设置文本靠上,中间,靠下
HTML+CSS基础代码 table中的tr中的td标签中的valign属性设置文本靠上,中间,靠下2016-09-25 10:10:33来源:优快云作者:yushaopu40人点击镇场诗:慈心积善来分享,无数技术誓愿学。学术有成当栽树,后人来此可乘凉。故吾诚心说愿望,愿见文者得利益。////////////////////////////////////////////////////////...
2018-04-06 17:39:48
1923
转载 你不能不知道的HTML常用代码
熟悉掌握了常用的HTML代码,你才能在编写网页的时候做到行云流水,用处处流露着细腻和创意的动效细节打动所有人。你不能不知道的HTML常用代码 html代码大全:结构性定义 文件类型<HTML></HTML> (放在档案的开头与结尾) 文件主题<TITLE></TITLE> (必须放在「文头」区块内) 文头<HEAD>...
2018-04-06 16:59:15
1313
转载 正则表达式常用示例
正则表达式是由一些具有特殊含义的字符组成的字符串,多用于查找、替换符合规则的字符串。在表单验证、Url映射等处都会经常用到。一、元字符元字符:即为有特定含义的字符,常见的元字符如下常用的元字符代码说明.匹配除换行符以外的任意字符\w匹配字母或数字或下划线或汉字\s匹配任意的空白符\d匹配数字\b匹配单词的开始或结束^匹配字符串的开始(在集合字符里[^a]表示非(不匹配)的意思$匹配字符串的结束详解...
2018-04-06 16:50:09
343
转载 正则表达式详解
原创 标签:正则表达式 /testing /regex /文本编辑 /events /腾讯7125概念是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串。在很多文本编辑器或其他工具里,正则表达式通常被用来检索和/或替换那些符合某个模式的文本内容。许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Un...
2018-04-06 16:46:34
142
转载 关于正则表达式的知识点整理
2016年02月19日 21:54:39478人阅读 评论(0) 收藏 举报 分类:正则表达式(1) 版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.youkuaiyun.com/pp_fzp/article/details/50700514正则表达式知识点小结整理1. \b 单词的开头或结尾,也就是单词的分界处.\b并不匹配这些单词分隔字符中的任何一个,它只匹配一个位置。(如...
2018-04-06 16:43:07
148
原创 计算圆的周长、面积、球 的体积
''' 计算圆的周长、面积、球的体积,得到如下结果:半径=12.0 周长=75.40 面积=452.39 体积=7238.23'''from math import piclass Model: def __init__(self): self._radius = 0 def setRadius(self, ra...
2018-03-30 22:15:57
4888
原创 今天把“类”说清楚
一、准确解读类:1、类是面向对象领域最基础的一个概念,也是面向对象分析和设计的基石。许多书和资料对类的解释通常是:“类是一组对象的抽象”。这个解释看是清晰明了,但实际上犯了个逻辑上的错误:以未明确的概念来解释待明确的概念,在什么是对象、什么是抽象还不明白的时候,却用这个解释类,容易看的是懂非懂。还有种解释:类就是属性和方法的集合!这里犯了一个本末倒置的错误:类是本,代码是末,只有清楚了类,才能写出...
2018-03-29 21:53:49
356
原创 Python关于路径方面的知识
Python解释器会根据(用sys.path调用的)列表中的路径来寻找模块,基本上来自以下几个来源:1、执行Python解释器时的文件夹;2、PYTHONPATH环境变量;3、Python安装的标准链接库等文件夹;4、PTH文件列出的文件夹。其中,PTH文件的部分,就是指可以在一个.pth文件中列出模块的搜索路径,一行一个路径。PTH文件的存放位置不同操作系统并不相同,可以通过site模块...
2018-03-29 01:12:43
337
原创 Python 模块里函数的调用方法和import语句的作用(适合初学者理解函数的调用)
一、五种函数调用方法(不够准确、全面,但初学者可以先这样理解):一是自建函数位于builtins模块中的函数,可直接调用。具体有那些函数?可通过dir(__builtins__)查看,共计152个(‘len(dir(__builtins__))’)。二是通过"import 模块"调用。如:import Boob,调用Boob模块中的函数(如toch时),使用方式是Boob.toch(),Boob....
2018-03-28 11:47:35
9520
1
原创 结合实例,详解类、类变量,实例、实例变量,作用域等内部运作关系,会对你有帮助!
class A: cls_i = 0 cls_j = {} def __init__(self): self.instance_i = 0 self.instance_j = {} self.H='qwer'#self.H叫实例变量H H=['a','b','c'] #叫类变量HH=('e',...
2018-03-25 08:32:39
325
原创 Python标准库中的模块unittest测试用例
1. unittest.TestCase类中的常用的断言方法方法用途assertEqual(a, b)核实 a == bassertNotEqual(a, b)核实 a != bassertTrue(x)核实 x 为TrueassertFalse(x)核实 x 为FalseassertIn(item, list)核实item在list中assertNotIn(item, list)核实item不在...
2018-03-18 13:07:12
772
备考全国计算机二级(Python)学习笔记之二
2018-12-04
备考全国计算机二级(Python)学习笔记之一
2018-12-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人