
python
文章平均质量分 55
Python
geodoer
一条热爱技术并且上进的咸鱼。
展开
-
[scrapy] scarpy+xpath与css:抓取页面内容
文章目录常用方法cssxpathpythoncsscss选择器举例xpath语法示例错误合集在scrapy中使用xpath、css常用方法css::text //提取出文本::attr(href) //属性有hrefxpath# text()获取文本内容"/..../text()" #获得文本内容# contains(属性,属性值) 包含"//span[ contains(...翻译 2019-02-02 14:49:26 · 1345 阅读 · 0 评论 -
[scrapy] pycharm开发scrapy - scrapy项目目录介绍
scrapy工程文件介绍【scrapy工程文件介绍】ArticleSpiderArticleSpiderSpiders 存放具体某个网站的爬虫__init__.pyjobbole.py 爬虫文件,使用命令scrapy genspider jobbole blog.jobbole.com生成__init__.pyitems.py 数据保存格式middlewares.py...原创 2019-01-26 10:33:00 · 414 阅读 · 0 评论 -
[Python] Python编程笔记
文章目录基础数据结构字符串dict输出调用命令行文件路径创建文件夹、复制移动文件压缩GISshp常用读写JSON基础数据结构字符串# ----- 查找string.find(str, beg=0, end=len(string) ) #[0, len)中是否有str,有返回索引值,无返回-1string.index(str, beg=0, end=len(string) ) #与f...原创 2019-12-30 12:15:42 · 454 阅读 · 0 评论 -
[PyQt5] 0 安装(python2 | python3)+pycharm使用
资料:python2.7+Qt4教程PyQt5参考指南PyQtPython安装PyQt pip install pyqt5 #Python3安装 pip2 install python-qt5 #Python2安装:import PyQt5使用designer.exe,创建.ui文件 pip install pyqt5-tools # 安装完成后designer.e...原创 2019-01-18 10:13:02 · 470 阅读 · 0 评论 -
[PyQt5] 1 布局+控件+信号与槽
布局垂直布局Vertical Layout:垂直摆放,间距均匀横向布局Horizontal Layout:横向摆放,间距均匀网格布局Grid Layout:把布局区域根据控件分成格子窗体布局Form Layout控件Label【目的】显示信息【功能】发射信号,配合槽函数实现特定功能修改样式表,显示图片self.labelName.setText(u"label文")...原创 2019-01-18 10:13:49 · 578 阅读 · 0 评论 -
[Python] Pyinstaller将python代码打包成exe | Pyinstaller错误合集
【常用命令】# 打包成单个文件夹pyinstaller my_excel.py #完成后在dist文件夹下# 打包为单个文件 -Fpyinstall -F my_excel.py# 不要命令行 -wpyinstall -F -w my_excel.py# 换图标pyinstall -F -w -i 图标路径(路径要\\) my_excel.py【注意】打包为单个文件(启动慢...原创 2019-01-18 10:18:26 · 2562 阅读 · 0 评论 -
[Python] 正则表达式re
【资源】官方说明:help(re) #命令行查看官方解释可视化正则表达式【特殊字符】常用功能说明“^”开头“^x”,以x字符开头“$”结尾“x$”,以x字符结尾“.”任意字符(≥0)“()”提取子串math_obj.group(1) #匹配成功后,拿出第一个括号里的子串“?”非贪婪匹配详细说明“|”或者“...原创 2019-01-21 16:17:30 · 272 阅读 · 0 评论 -
[爬虫] 爬虫策略+爬虫去重
深度优先、广度优先# 深度优先def depth_tree(tree_node): if tree_node is not None: print (tree_node._data) if tree_node._left is not None: return depth_tree(tree_node._left) if tree_node._right is not No...原创 2019-01-22 09:18:21 · 724 阅读 · 0 评论 -
[Python] 编码问题
文章目录编码问题Python编程编码问题【背景】计算机只能处理数字,文字转换为数字才能处理计算机中8bit作为一个字节,所以一个字节能表示最大的数字就是255常用编码说明问题及其他ASCII一个字节可以表示完26个字母->ASCII(一个字节)编码就成为美国人的标准编码ASCII用于中文明显不够,中文不止255个汉字GB2312用两个字节表示一...原创 2019-01-16 22:08:47 · 223 阅读 · 0 评论 -
[Flask] 10分钟使用Python做后台 | 零基础立刻上手flask
本人有JavaWeb基础、Python基础因Python使用爬虫,需要使用flask做前后端交互【选择flask原因】项目需要使用地图进行交互,无奈博主没有接触过Python+地图(开源有folium)使用的是Python爬虫,刚好与flask对接使用前【巨坑!】一定要设置【后果】静态文件修改无用清除浏览器缓存关闭浏览器缓存创建flask工程pycharm创建工...原创 2019-03-17 21:07:13 · 1493 阅读 · 0 评论 -
[Flask] 移植flask工程 | 实现"零部署" | 绿色版解压即可用
【遇到一个项目】需要用Python爬虫用户需要有地图进行交互【传统做法】Tomcat + Python脚本将Python爬虫的代码打包成exe,方便Java调用用浏览器做交互,使用ArcGIS api for javascript等地图操作框架使用Tomcat做服务器,再调用exe实现业务逻辑例子:https://blog.youkuaiyun.com/summer_dew/article...原创 2019-04-05 22:18:04 · 914 阅读 · 0 评论 -
[Python] 将指定文件压缩成zip | 将shp为zip
import zipfilezipf = zipfile.ZipFile(zippath,'w') # 在路径中创建一个zip对象 # zippath:zip文件全路径,例:D:\Users\XXX\Desktop\arcgis\filename.zipzipf.write(addedfilepath, arcname) # 写文件 # addedfilepath:将要压缩的文...原创 2018-06-16 22:38:18 · 5923 阅读 · 0 评论 -
[文件] Python读取txt存储至xls
Python读取txt存储至xls原创 2018-03-28 23:02:09 · 1035 阅读 · 0 评论 -
[Python] Python与Excel--只读|只写|读写|创建图表
python对excel的操作,只读、只写、读写、创建图表。原创 2017-10-08 09:49:10 · 4646 阅读 · 0 评论 -
[Python] openpyxl读存大数据 Exception: String longer than 32767 characters
xlwt缺点:版本 只能处理Excel97-2003或Excel 97之前版本的xls格式存储数据过大 存储数据过大时,会报错Exception: String longer than 32767 characters OpenPyXL可以解决以上情况,OpenPyXL缺点: 读取xls格式时load_workbook函数utf-8报错下载:链接http://pan...原创 2017-11-04 20:35:46 · 16046 阅读 · 0 评论 -
[Python] 识别图像中的文字--pytesser模块
识别图像中的文字,Pytesser模块,识别英文文字,中文解析较差。原创 2018-01-14 20:27:21 · 2043 阅读 · 1 评论 -
[Python] RuntimeError: maximum recursion depth exceeded|MemoryError: stack overflow 递归|堆栈限制
RuntimeError: maximum recursion depth exceeded。Process finished with exit code -1073741571 (0xC00000FD)。MemoryError: stack overflow。Python递归、堆栈限制。翻译 2018-01-05 11:16:30 · 2079 阅读 · 0 评论 -
[Android] adb Android调试工具
adb相关应用原创 2018-01-11 10:44:09 · 1857 阅读 · 0 评论 -
[Python] ENVI|SARscape常用的Python脚本
ENVI软件SARscape模块常用的Python脚本。原创 2018-02-11 11:59:17 · 2889 阅读 · 2 评论 -
[爬虫] 哨兵数据的精轨数据|自动下载|爬取链接并下载文件
Python爬取链接并下载链接的文件,以下载哨兵的精轨数据为例。涉及内容:url参数解析,urllib获取网页,获得下载链接,urllib下载文件。Python:获取日期的前一天,字符串中指定位置加入指定字符。原创 2018-01-13 20:04:08 · 11387 阅读 · 11 评论 -
[Python] 调用接口自动翻译单词,并存入文件
自动翻译单词 并按规则存入Excel中的单词原创 2018-04-08 15:53:00 · 1102 阅读 · 0 评论 -
[Python] windows下Python2与3多版本控制
windows下python多版本控制原创 2017-09-22 22:50:49 · 1033 阅读 · 0 评论 -
[Python] python基础 - 安装拓展包(pip | 手动) | 虚拟环境virtualenv
python安装pip,修改pip下载源,使用Pip下载拓展包。原创 2018-04-01 15:31:57 · 1933 阅读 · 0 评论 -
[Pydub] 读取mp3报错|Couldn't find ffmpeg or avconv - defaulting to ffmpeg, but may not work
python音频包,报错Couldn't find ffmpeg or avconv - defaulting to ffmpeg, but may not work,解决方案。原创 2018-04-14 22:32:26 · 11542 阅读 · 4 评论 -
[爬虫] Python爬虫技巧
原文链接:http://python.jobbole.com/84622/基本抓取网页get方法post方法使用代理Cookies处理伪装成浏览器页面解析验证码的处理gzip压缩多线程并发抓取基本抓取网页get方法import urllib2url "http://www.baidu.com"respons = urllib2.urlopen(url)print resp转载 2017-10-01 22:30:30 · 603 阅读 · 0 评论