
python
文章平均质量分 61
iloster
这个作者很懒,什么都没留下…
展开
-
用python写的下载网页中的图片
最近在学python,发现python很适合写爬虫,我写了一个简单的,下载某一网页中的图片import reimport urllibdef getHtml(url): page=urllib.urlopen(url) html=page.read() #打开网页 return htmldef getJpg(html): reg=r'src="(.*?\.jpg)原创 2013-12-06 21:51:44 · 1157 阅读 · 0 评论 -
python暴力破解含密码的zip压缩文件
python有zip的类库,解压缩zip文件很方面,代码中,我没有使用多线程,如果追求速度的话,可以使用多线程思路:1.先自己生成一份txt的密码字典2.然后读取出来,一个个的尝试,当密码错误是,程序会报错中断,所以密码错误,要使用pass3.当解压缩成功后,中断程序,输出正确密码import zipfileimport osfrom threading import Th原创 2014-04-12 12:25:16 · 4503 阅读 · 0 评论 -
python将下载地址转换成迅雷和qq旋风的下载地址
迅雷和qq旋风下载,有加速和离线功能,很方面,我是在网上看到的原始地址和迅雷地址,qq旋风地址的转化原理,然后用python+pyqt写了一个客户端原理:迅雷: 迅雷下载地址="thunder://"+Base64编码("AA"+"真实地址"+"ZZ")QQ旋风: qqdl="qqdl://"+Base64编码("真实地址")import reimport base64from原创 2014-04-27 15:03:47 · 3604 阅读 · 1 评论 -
网页解析正则表达式
在写爬虫的过程中,最麻烦的就是写正则表达式,还要一个一个的尝试,一次次的调试,很是费时间。于是我就写了一个网页版的,只需要输入要爬的网址,和正则式,网页上就可以显示爬到的数据。思路:其实很简单,将网址和正则式传到服务器,服务器解析之后,将结果返回到前端。我用的是bootcss(前端)+bottle(后台用python处理),代码很简单,就是过程有些复杂。由于传递的参数是一个网址,而后台判断参数原创 2014-10-29 09:37:21 · 1676 阅读 · 0 评论 -
在apache中配置python框架bottle
最近在将打包工具改成web版的,这样就不用每个人都配置自己的电脑了,我环境用的是win7(x64)+bottle+apache,比较简单。开始按照官方文档去配置,发现怎么改,都无法访问,最后无意中弄好了,在这里记录下。 1.下载mod_wsgi,由于我的电脑是64位的,而官网下载到的都是32位的,如果直接用会导致apache运行不正常。64位网址:http://www.lfd.uci.ed原创 2014-12-08 15:32:10 · 2250 阅读 · 3 评论 -
python解析xml并按照其结构输出
python解析xml原创 2015-01-04 17:41:20 · 1958 阅读 · 0 评论 -
(python) 统计代码行数
最近公司申请著作版权,需要统计代码的行数,用网上找了下工具,还得安装什么的,感觉不靠谱,就自己写了一个python脚本统计一下1.原理:先获取所有文件,然后统计每个文件中代码的行数,最后将行数相加,思路很简单。import osimport os.pathimport timerootdir = '文件路径'filelists = []#遍历文件def getFile(rootdir):原创 2015-03-19 14:27:01 · 889 阅读 · 0 评论 -
(python)获取阅FM网站的文章数据
看了很小清新应用(火柴盒,一个,阅FM),自己也想做一把文艺青年,做一个文艺应用,但是没有数据,只能自己去爬了,打开阅FM网站和Fildder逐个分析链接,发现了上图圆圈里的链接,复制到浏览器中打开,不正是我们想要的吗多次尝试可以发现,这个链接每次返回的结果都是不一样的,所以有这一个链接就够了,下面的工作就是获取数据,然后保存到数据库中了原创 2015-03-03 21:34:53 · 848 阅读 · 0 评论 -
统计知乎问题点赞用户的信息及可视化
好久没有写博客,感觉不能这样荒废下去了,以后的话一周至少一篇原创吧。废话不多说,进入正题,现在很多人认为知乎成为一个发广告的地方,很多水军,看着他们撕逼很有意思,然后就想将点赞用户的信息展示出来,更好的分析哪些是软文哪些事干货。我用的是flask搭建的一个网站,用python去爬去分析数据,前端用chart.js,展示数据。 第一步:爬取数据 首先用Fiddle进原创 2015-11-19 19:36:29 · 1297 阅读 · 0 评论 -
(python)下载秒拍美拍视频
最近在写一个应用,需要收集微博上一些热门的视频,像这些小视频一般都来自秒拍,微拍,美拍和新浪视频,而且没有下载的选项,所以只能动脑想想办法了。第一步 分析网页源码。 例如:http://video.weibo.com/show?fid=1034:0988e59a12e5178acb7f23adc3fe5e97,右键查看源码,一般视频都是mp4后缀,搜索发现没有,但是有的直接就能看到了比如美拍的视频原创 2015-12-03 20:36:52 · 2750 阅读 · 0 评论 -
python获得bing壁纸,并下载到本地
微软bing搜索每天都会换一张壁纸,而且分辨率都高,很适合当做壁纸,写了一个python去获取张壁纸,代码很简单import urllibimport reimport timedef getHtml(url): return urllib.urlopen(url).read()def getImgUrl(html): reg=re.compile(r'(http:/原创 2014-04-27 19:15:53 · 1403 阅读 · 0 评论 -
python将文本转化成gif图片阅读
这是python吧的一个帖子(http://tieba.baidu.com/p/3030737423),具体的就是,导入txt文档,然后就会生成像一个gif的界面,文字不断的更换,用这种方法看文档,如图:代码:# -*- coding: utf-8 -*#-------------------------------------import pygamefrom pygame原创 2014-05-10 10:42:49 · 1663 阅读 · 0 评论 -
python获取韩寒one(一个)中的图片和文章
以前韩寒的one(一个)是腾讯帮忙维护的,网页是不让粘贴复制的,当然用某些方法还是可以做到的,现在启用了独立网站,感觉界面挺不错的,平时也比较喜欢里面的图片和文字,自己写了个程序爬一下里面的东西import urllibimport osimport re#获取网页源码def getHtml(url): return urllib.urlopen(url).read()#获取原创 2013-12-28 14:11:54 · 1377 阅读 · 1 评论 -
查找获取百度网盘里的资料(python版)
之前用php写了一个方法,感觉那个效果不是很好,学了python的正则之后,用写了一个python版的,大概功能差不多,只是,更加清楚了import reimport urllib#关键字qword=raw_input('input some word:')#返回结果的条数,好像得是10的倍数,或者小于10rn=raw_input('input the number:')#分析百原创 2013-12-28 21:29:33 · 2162 阅读 · 0 评论 -
python写的一个简单的英汉翻译
注意: 1 安装pyqt模块 2.python的IDLE默认编码为utf-8 3.去http://fanyi.youdao.com/openapi?path=data-mode,申请一个api key# -*- coding: utf-8 -*- import sysfrom PyQt4 import QtGui,QtCoreimport urllibimpor原创 2014-03-07 13:05:56 · 2184 阅读 · 1 评论 -
用pyqt写的一个可以下载网页中所有图片的程序
python做爬虫的效率很高。然后用上pyqt做一个界面,写了一个可以下载任意网页上所有图片的程序import sysfrom PyQt4 import QtGui,QtCoreimport urllibimport osimport reimport threadimport threadingclass Main_QWidget(QtGui.QWidget): de原创 2014-03-08 20:00:08 · 1278 阅读 · 0 评论 -
python实现lol解说抽奖
平时没事干的时候,会看看优酷lol视频,每期节目开始,解说都会用一个软件,从评论该视频的观众中抽奖,看了之后,想自己试试,只有代码,没有界面 实现步骤: 1,给评论翻页时,发现网址没有变,可以知道是该页面通过ajax获取数据,直接爬是行不通的2,用httpWatch分析,得到http://comments.youku.com/comments/~ajax/vpcommentConten原创 2014-04-18 20:39:28 · 1353 阅读 · 0 评论 -
python远程监控
最近用python写了一个远程监控的程序,主要功能有: 1.用邮件控制所以功能 2.可以对屏幕截图,屏幕截图发送到邮箱 3.可以用摄像头获取图片,这些图片上传到七牛 4.开机自启动##coding by loster#import win32apiimport win32conimport platformimport socketimport time原创 2014-03-25 10:55:38 · 1725 阅读 · 3 评论 -
用python获取贴吧中留下的邮箱
正所谓得屌丝着得天下,贴吧就是屌丝们聚集的地方,有时候会看到楼主发一个福利帖子,然后下面留下几页的邮箱。这么多邮箱,收集起来就可以做一些邪恶的事情我的思路:(我没有用多线程,如果你想大量收集的话,可以采用多线程)1.获取首页的50个帖子的地址2.进入每个帖子,获取帖子的页数3.如果这个帖子第一页没有邮箱,就爬下一个帖子,免得浪费资源4.我只是把邮箱打印出了,需要的话自己可以写进原创 2014-04-06 11:57:09 · 1508 阅读 · 1 评论 -
python统计最近几天访问的网站次数
数据是从chrome中的History分析出来的,它用的是sqlite数据库,python有接口import sqlite3import threadimport timeimport datetimeimport redef getHistoryDB(): path='C:\Users\Administrator\AppData\Local\Google\Chrome\Us原创 2014-03-27 21:51:02 · 2324 阅读 · 0 评论 -
python获取bt种子的详细信息
bt种子具体文件结构如下: 全部内容必须都为bencoding编码类型。 整个文件为一个字典结构,包含如下关键字 announce:tracker服务器的URL(字符串) announce-list(可选):备用tracker服务器列表(列表) creation date(可选):种子创建的时间,Unix标准时间格式,从1970 1月1日 00:00:00到创建时间的秒数(整数原创 2014-04-23 14:56:26 · 4593 阅读 · 1 评论 -
python将文字转换成图片
现在又很多工具能将文字转换成图片,这样就可以发送长微博,其实python实现这很容易的,主要就是用到了pygame模块import osimport pygamefrom pygame.locals import *pygame.init() text = u"这是一段测试文本,test 123。"font = pygame.font.SysFont('SimHei', 14)原创 2014-05-09 22:39:45 · 2465 阅读 · 0 评论 -
(python)下载喜马拉雅电台的音频
上一篇文章讲了如何分析,寻找视频的下载链接。其实获取喜马拉雅电台音频的链接方式也是如此,通过chrome的Network调试工具去寻找页面链接与下载链接之间的关系。第一步:分析页面源码直接pass了,源码中没有音频的下载链接,当然有的网站是有的,比如荔枝FM,有的话直接解析就好了,没有话,就看下一步了第二步:chrome调试打开chrome调试工具,逐一分析打开音频之后的网络请求和结果,以http:原创 2015-12-05 20:10:03 · 3171 阅读 · 0 评论