
python
qiye_
这个作者很懒,什么都没留下…
展开
-
python开发ftp服务器第一天(pyftpdlib)
python开发ftp服务器原创 2016-03-01 11:23:50 · 6850 阅读 · 0 评论 -
Scrapy爬取美女图片第四集 突破反爬虫(上)
本周又和大家见面了,首先说一下我最近正在做和将要做的一些事情。 技术方面的事情:本次端午假期没有休息,正在使用flask开发自己的个人博客框架,之后我的技术教程将会陆续更新flask方面的内容,尽可能的形成一套完整的flask开发教程。之后打算再开通一个微信公众号,自己使用python开发微信公众号后台,给大家提供一些生活上的服务,例如及时提醒一些商家优惠信息原创 2016-09-20 21:12:29 · 1705 阅读 · 16 评论 -
python开源IP代理池--IPProxys
今天博客开始继续更新,谢谢大家对我的关注和支持。这几天一直是在写一个ip代理池的开源项目。通过前几篇的博客,我们可以了解到突破反爬虫机制的一个重要举措就是代理ip。拥有庞大稳定的ip代理,在爬虫工作中将起到重要的作用,但是从成本的角度来说,一般稳定的ip池都很贵,因此我这个开源项目的意义就诞生了,爬取一些代理网站提供的免费ip(虽然70%都是不好使的,但是扛不住量大,网站多),检测有效性后存储到数原创 2016-10-17 12:18:54 · 7060 阅读 · 0 评论 -
百度登录加密协议分析(上)
本周又和大家见面了,没什么特殊情况,一般是一周一篇原创。发布的时间基本上是在周末,平时还是比较忙碌的。最近在开发自己的博客,过段时间可以和大家分享开发博客中的技术点。如果大家想及时的和我交流的话,可以关注文章最后的微信公众号,这样我可以比较及时的知道大家的想法。 好了,废话不多说,咱们进入今天的主题,讲解一下前段时间做的百度登录加密协议分析,由于写的比较详细,篇幅有点多,所以就分为上原创 2016-10-17 12:24:04 · 2760 阅读 · 0 评论 -
sublime Text3 插件编写教程_第一课
今天给大家分享一下编写一个Sublime Text3 插件的流程以及使用插件解决的一个实际问题。 一、开发插件的前提条件开发sublime插件用到的是Python语言,因此必须懂Python语言的基础语法。学习Python语言,推荐学习廖雪峰的Python教程(http://www.liaoxuefeng.com/)。编写插件处理文本用到正则表达式的地方非常多,尽量了原创 2016-12-22 10:14:18 · 1808 阅读 · 5 评论 -
原创爬虫开源项目——更新维护
前言 已经有十几天没有更新文章了,但是这些天并没有闲着,状态和封面上的人一样,写代码和思考。。。最近事宜 这些天主要干了些什么事情呢?这个必须要给大家说一下,不然大家以为我消失了呢。这些天一直在维护我github上的两个开源项目,一个是IPProxy(代理IP池),另一个是spider_smooc(慕课网视频抓取器,无需账号密码)。这两个项目都在博客园进行原创 2016-12-22 10:16:46 · 1126 阅读 · 0 评论 -
requests发送post请求的一些疑点
前言在Python爬虫中,使用requests发送请求,访问指定网站,是常见的做法。一般是发送GET请求或者POST请求,对于GET请求没有什么好说的,而发送POST请求,有很多朋友不是很清楚,主要是因为容易混淆POST提交的方式。今天在微信交流群里,就有朋友遇到了这种问题,特地讲解一下。在HTTP协议中,post提交的数据必须放在消息主体中,但是协议中并没有规定必须使用什么编码方式,从而...原创 2018-05-20 11:33:42 · 32126 阅读 · 2 评论 -
新版知乎登录之post请求
前言在上一篇文章中给大家讲解了requests发送post请求的几种方式,并分析了一些使用陷阱。疑惑在文章发表之后,有朋友给我留言说,知乎登录就没有使用提交Form表单(application/x-www-form-urlencoded)的方式,而是上传文件(multipart/form-data),这是为什么呢?知乎登录post请求该怎么发送呢?本质我想说的是一般情况...原创 2018-05-23 17:15:57 · 2066 阅读 · 0 评论 -
python爬虫-爬取盗墓笔记
本来今天要继续更新 scrapy爬取美女图片 系列文章,可是发现使用免费的代理ip都非常不稳定,有时候连接上,有时候连接不上,所以我想找到稳定的代理ip,下次再更新 scrapy爬取美女图片之应对反爬虫 文章。 好了,废话不多说,咱们进入今天的主题。这一篇文章是关于爬取盗墓笔记,主要技术要点是scrapy的使用,scrapy框架中使用mongodb数据库,原创 2016-09-20 21:07:14 · 2251 阅读 · 7 评论 -
Scrapy爬取美女图片第三集 代理ip(下)
这是我的公众号获取原创保护的首篇文章,原创的肯定将支持我继续前行。现在写这篇文章的时间是晚上11:30,写完就回寝室休息了,希望更多的朋友与我一起同行(当然需要一个善良的妹子的救济)。 好了,废话不多说,咱们进入今天的主题。上一篇咱们讲解了代理ip上篇,本篇咱们继续讲解代理ip。这一篇是上一篇的扩展和优化,主要的改动是使用scrapy来进行爬取代理ip,同时演示在scrapy原创 2016-09-05 10:42:19 · 1171 阅读 · 0 评论 -
python发送邮件
这段时间一直在学习flask框架,看到flask扩展中有一个mail插件,所以今天就给大家演示如果发邮件。 首先我注册了一个163邮箱,需要开启smtp功能,因为咱们python发送邮件经过的是smtp.163.com(网易的电子邮件服务器)。注册好163邮箱,然后开启smtp功能,如下图所示:开启的过程中需要绑定手机。原创 2016-03-19 15:26:09 · 988 阅读 · 0 评论 -
七夜在线音乐台开发 第一弹 (原创)
从今天起,我就要开始七夜在线音乐台的开发。七夜音乐台确定采用flask web框架,音乐源采用网易音乐(仅做技术演示,不做商业用途)。项目从设施,设计,开发,部署,上线几个方面展示web开发的整个流程。 今天咱们先讲一下设施,为什么要讲设施?因为最后咱们的web应用是要在服务器上运行,可以供大家访问。所以今天说一下购买服务器和域名(很多初学者朋友都是在本地搭建,对此不是很清楚,玩原创 2016-03-25 17:31:19 · 703 阅读 · 0 评论 -
七夜在线音乐台开发 第二弹
上一篇我讲了一下七夜在线音乐平台的服务器与域名,也就是设施部分。今天我将大体上的设计思路,技术要点,和大家分享一下。 项目需求: 我的目标是设计一个在线音乐平台,大家可以随时点播自己喜欢的歌曲,支持多样化检索,并且根据个人喜好,进行推荐。同时用户可以自定义歌单,支持收藏等功能。提供移动端API接口,可以供app开发使用。 项原创 2016-04-12 11:34:23 · 608 阅读 · 0 评论 -
Scrapy爬取美女图片续集
上一篇咱们讲解了Scrapy的工作机制和如何使用Scrapy爬取美女图片,而今天接着讲解Scrapy爬取美女图片,不过采取了不同的方式和代码实现,对Scrapy的功能进行更深入的运用。 在学习Scrapy官方文档的过程中,发现Scrapy自身实现了图片和文件的下载功能,不需要咱们之前自己实现图片的下载(不过原理都一样)。 在官方文原创 2016-04-30 20:36:55 · 1927 阅读 · 1 评论 -
七夜在线音乐台开发 第三弹 爬虫篇
上一篇咱们讲到了七夜音乐台的需求和所需要的技术。咱们今天就讲一下爬虫,为什么要讲爬虫,因为音乐台的数据源需要通过爬虫来获取,不可能手动来下载。下图是一个网络爬虫的基本框架:网络爬虫的基本工作流程如下: 1.首先选取一部分精心挑选的种子URL;2.将这些URL放入待抓取URL队列; 3.从待抓取URL队列中取出待抓取在URL,解原创 2016-05-12 22:29:06 · 1022 阅读 · 0 评论 -
Scrapy爬取图片
有半个月没有更新了,最近确实有点忙。先是华为的比赛,接着实验室又有项目,然后又学习了一些新的知识,所以没有更新文章。为了表达我的歉意,我给大家来一波福利。。。 今天咱们说的是爬虫框架。之前我使用python爬取慕课网的视频,是根据爬虫的机制,自己手工定制的,感觉没有那么高大上,所以我最近玩了玩 python中强大的爬虫框架Scrapy。原创 2016-04-24 21:15:23 · 7028 阅读 · 6 评论 -
Scrapy爬取美女图片第三集 代理ip(上)
首先说一声,让大家久等了。本来打算520那天进行更新的,可是一细想,也只有我这样的单身狗还在做科研,大家可能没心思看更新的文章,所以就拖到了今天。不过忙了521,522这一天半,我把数据库也添加进来了,修复了一些bug(现在肯定有人会说果然是单身狗)。 好了,废话不多说,咱们进入今天的主题。上两篇 Scrapy爬取美女图片 的文章,咱们讲解了scrapy的用法。可是就在最近,有热原创 2016-09-05 10:39:04 · 1314 阅读 · 0 评论 -
BaseProxy:异步http/https中间人
BaseProxy异步http/https代理,可拦截并修改报文,可以作为中间人工具.仅支持py3.5+.项目地址:BaseProxy。意义BaseProxy项目的本意是为了使HTTP/HTTPS拦截更加纯粹,更加易操作,学习成本更低。在Python领域,中间人工具非常强大和成功的是MitmProxy,但是有些地方不是很喜欢。 - Windows上安装比较费时费力 - 功能...原创 2018-06-23 11:10:33 · 690 阅读 · 1 评论