
python
文章平均质量分 68
jirryzhang
。
展开
-
基于Scrapy爬取网页文章
用Scrapy框架爬取网页的一系列技术文章,以伯乐在线为例(网址为http://blog.jobbole.com/tag/machinelearning/)。通过查看网站源码获取每篇文章的链接和标题,将标题作为文件名,网页正文的内容作为文件内容批量保存到本地。settings定义爬取的一些设置如下;# -*- coding: utf-8 -*-# Scrapy settings for原创 2016-10-14 14:59:03 · 4396 阅读 · 0 评论 -
PyInstaller用法
简单总结PyInstaller使用方法:生成单一的exe文件:pyinstaller -F test.py添加必要的搜索路径:pyinstaller -F -p D:\tmp\tmp_dev_root\python\tutorial_summary\make_exe\BlogsToWordpress\libs;D:\tmp\tmp_dev_root\python\t原创 2017-12-23 18:41:18 · 91237 阅读 · 31 评论 -
python实现tcp服务器
# -*- coding:utf-8 -*-import SocketServerimport sysimport tracebackclass MyServer(SocketServer.BaseRequestHandler): def handle(self): conn = self.request conn.sendall('我是多线程原创 2017-05-20 18:22:48 · 528 阅读 · 0 评论 -
用scrapy爬取学校教师的个人信息
基于scrapy和beautifulsoup框架,可以方便地从网页爬取我们所需要的信息,无论中文,数字或者是英文信息,均可以按找我们希望的方式爬取下来。这次我想爬取我们学院主页的所有老师的个人信息,包括职称,电话,办公室地址和电子邮箱。pipelines如下:from teacher1 import settingsimport osimport urllibfrom bs4 i原创 2016-10-15 20:20:50 · 3170 阅读 · 1 评论 -
python提取字符串中的所有数字
用re库来实现。如下字符串为“2336年1月9日”,想提取出其中的2336,1,9这些数字,可用正则表达式‘\d+’来匹配,代码如下:import restr1 = '2366年1月9日'pattern = re.compile(r'\d+')res = re.findall(pattern, str1)for i in res: print unicode(i, '原创 2017-02-15 14:44:23 · 19459 阅读 · 1 评论 -
python qt(pyqt)的文件打开、文件保存、文件夹选择对话框
首先导入pyqt4模块:import PyQt4.QtCore,PyQt4.QtGui获取文件路径对话框:file_name = QFileDialog.getOpenFileName(self,"open file dialog","C:\Users\Administrator\Desktop","Txt files(*.txt)") ##"open file Dia原创 2017-03-01 12:35:30 · 40860 阅读 · 3 评论 -
包含中文字符的QString对象转换为python的string对象的方法
最近做的一个项目中,用pyqt4做一个界面,需要用lineEdit控件接收用户的中文输入,以查找或者修改数据。由于python2对中文支持不是太好,所以一开始出现了很多问题。经过多番尝试,后来终于解决了,方法如下:我用lineEdit.text()获取lineEdit控件里的字符串,该对象为QString对象,为了方便和python其他模块交互,我需要将其转换为python支持的string对原创 2017-02-10 12:44:40 · 2514 阅读 · 0 评论 -
pyqt4使用qt designer设计的ui文件的方法(将ui文件转换为python源码和类的方法)
在pyqt4的文件夹里搜索找到pyuic.py这个脚本,然后将其复制到ui文件所在的文件夹(其实也可以不这么做,我是为了方便而这么做)。在配置好python环境的命令行窗口中转到ui所在的文件夹,输入命令python pyuic.py test.ui -o testUi.py其中test.ui为你要用的ui文件,testUi.py为ui文件被转换输出的python源码,里面会有Ui_tes原创 2017-02-10 12:29:48 · 8704 阅读 · 0 评论 -
Python执行带参数的外部程序
用python的subprocess模块的popen类执行新的外部程序,可以带参数代码如下:#encoding=utf-8import subprocesssh=r'F:\program files\SHplayer\5.0.2.34\SHPlayer.exe'#这里r可以可以不管空格和中文字符的烦恼avi=r’F:test.avi’runavi=subprocess.Popen(sh+原创 2016-10-11 21:22:45 · 9359 阅读 · 0 评论 -
pyqt自定义信号与槽
如下:from PyQt5 import QtWidgets, QtCorefrom qtTeUi import Ui_Formimport timeclass MyWindow(QtWidgets.QWidget, Ui_Form): _signal = QtCore.pyqtSignal(str) # 定义信号,定义参数为str类型 def __init__(原创 2017-12-23 18:44:59 · 2310 阅读 · 0 评论