
python
文章平均质量分 54
hp_cpp
这个作者很懒,什么都没留下…
展开
-
python2.7 安装pymongo
安装环境:win7 64位 + python2.7.3 win10 64位 + python2.7.3 利用easy_install方式进行安装pymongo (1)先安装easy_install 进入下载页面:https://pypi.org/project/setuptools/#files 下载如图所示源码版,解压,在cmd中进入解压后的文件...原创 2018-05-11 10:15:42 · 6416 阅读 · 0 评论 -
pytho2.7.x+requests+xpath爬取电影天堂
python2.7.x,和python3.x处理中文乱码方式不一样。遇到问题就百度,遇到python2的中文乱码问题可以参考这几篇博客:https://blog.youkuaiyun.com/hp_cpp/article/details/80953508https://blog.youkuaiyun.com/hp_cpp/article/details/80997208https://blog.youkuaiyun.com/h...原创 2018-12-06 10:11:41 · 2345 阅读 · 0 评论 -
UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' in position
在GBK解码时忽略掉不能解码的数据 self.file.write(content.encode("gbk", 'ignore').decode("gbk", "ignore"))转自:http://www.cnblogs.com/vevy/p/9212981.html转载 2018-12-05 20:12:21 · 8076 阅读 · 1 评论 -
python2.7.x+requests+正则表达式爬取《糗事百科》段子
糗事百科url为https://www.qiushibaike.com/text/page/1/其中后面的/1/表示第几页,这里只爬取前面7页,具体看下面的代码。(在chrome浏览器中,利用开发者工具,查看到的元素和在pycharm中requests.get请求下来的网页不一样,标签变了,导致按照视频教程的正则匹配不到。于是,自己在pycharm中查看标签,重新写正则匹配式。)#!/usr...原创 2018-12-08 17:51:22 · 283 阅读 · 0 评论 -
python2.7.x+requests+正则表达式爬取古诗网诗词
这次用正则表达式进行爬取链接地址:https://www.gushiwen.org/default_1.aspx同样是爬取前7页的数据#!/usr/bin/env python # -*- coding:utf-8 -*-import requestsimport redef parse_page(url): headers = { 'User-Agen...原创 2018-12-08 15:31:35 · 411 阅读 · 0 评论 -
python2.7.x+request+xpath爬取腾讯招聘信息
依然采用是requests和xpath,因为是简单爬虫的入门教程,边学边记录。腾讯招聘的url是https://hr.tencent.com/position.php点击下面的第2页,得到url:https://hr.tencent.com/position.php?&start=10#a再点击第一页,得到url:https://hr.tencent.com/position.php...原创 2018-12-08 13:54:43 · 422 阅读 · 0 评论 -
(转)python中强大的format函数
转自:https://www.cnblogs.com/gide/p/6955895.html自python2.6开始,新增了一种格式化字符串的函数str.format(),此函数可以快速处理各种字符串。语法它通过{}和:来代替%。请看下面的示例,基本上总结了format函数在python的中所有用法#通过位置print '{0},{1}'.format('chuhao',20)pr...转载 2018-12-05 10:53:57 · 151 阅读 · 0 评论 -
pyzmq利用PyInstaller打包成exe,打包和运行过程中遇到的一些问题解决记录
python版本是2.7.3,MSC v.1500 64位(AMD64)PyInstaller版本是3.4,用pip安装的。遇到的问题如下:(1)PyInstaller没安装好,解决办法:重装PyInstaller,然后写一个简单的测试py文件,将其打包成exe,运行成功,则说明PyInstaller环境安装好。(2)import zmq库后,使用zmq的类和方法,将其打包成的exe,运行...原创 2018-10-22 12:24:06 · 1106 阅读 · 0 评论 -
python版本的ZeroMQ安装和帮助文档
前提条件1) 已经安装python,并且将其加入到环境变量中;(安装完成后,在windows环境变量系统变量Path中增加:python.exe所在目录(如:C:\Python),其下Scripts目录(如:C:\Python\Scripts))。2)已经安装了pip.exe,并且将其加入到环境变量中。下载pyzmqhttps://pypi.org/project/pyzmq/#file...原创 2018-10-10 15:21:06 · 2870 阅读 · 0 评论 -
python路径拼接os.path.join()函数(windows平台上为例)
python路径拼接os.path.join()函数(windows平台上为例)函数原型os.path.join(path1[, path2[, …]])该函数用于文件路径拼接,不确定参数,可以同时对多个路径进行拼接。注意事项从右边开始数,遇到第一个以”/”开头的参数,开始拼接,这个参数左边的全部丢弃;以上一种情况为先。在上一种情况确保情况下,若出现”./”开头的参数,会从”./”开...原创 2018-10-10 15:01:30 · 12982 阅读 · 0 评论 -
强行停止python子线程最佳方案
转自:https://blog.youkuaiyun.com/zhao_5352269/article/details/81662099子线程的强制性终止是我们实际应用时经常需要用到的,然而python官方并没有给出相关的函数来处理这种情况。网上找到一个挺合理的解决方案,这里分享给大家。import threadingimport timeimport inspectimport ctypes ...转载 2018-10-13 17:00:18 · 15768 阅读 · 4 评论 -
python中chardet字符串编码方式
转自:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001510905171877ca6fdf08614e446e835ea5d9bce75cf5000(仅供学习使用,若给原作者造成任何不便,即刻删除)字符串编码一直是令人非常头疼的问题,尤其是我们在处理一些不规范的第三方网...转载 2018-10-13 16:54:46 · 1144 阅读 · 0 评论 -
python ZeroMQ实现1:N,异步收发消息(也可向指定客户端发送消息)
ZeroMQ的python版本和C/C++版本的接口差不多,要实现一个server对N个client,异步方式,而且可以对指定的client发送消息,可以这样:server采用ROUTER方式,client采用DEALER方式,而且要自己制定client的zmq.IDENTITY(如果不指定,zmq就会自动生成一个,不好控制对制定的client发送消息。)server.py#!/usr/bi...原创 2018-10-13 16:41:23 · 4317 阅读 · 0 评论 -
python中coding:utf-8和setdefaultencoding区别和“UnicodeDecodeError: 'ascii' codec can't decode byte 的问题解决
两种方式的区别一、 # coding:utf-8 定义源代码的编码. 如果没有定义, 改源码中是不可以包含中文字符串的. 官方链接:https://www.python.org/dev/peps/pep-0263/二、sys.getdefaultencoding() 是设置默认的string的编码格式。另外: 在python2.x的字符编码问题时常会遇到“UnicodeEnco...原创 2018-07-07 18:04:48 · 588 阅读 · 0 评论 -
Python2.x(python2.7中遇到过)解决UnicodeEncodeError: 'gbk' codec can't encode character u'\xa0'问题
一、什么是\xa0\xa0 是不间断空白符   我们通常所用的空格是 \x20 ,是在标准ASCII可见字符 0x20~0x7e 范围内。 而 \xa0 属于 latin1 (ISO/IEC_8859-1)中的扩展字符集字符,代表空白符nbsp(non-breaking space)。 latin1 字符集向下兼容 ASCII ( 0x20~0x7e )。通常我们见到的字符多数...原创 2018-07-07 17:33:22 · 1982 阅读 · 0 评论 -
PySide2的在线安装
PySide2的在线安装地址在这里: https://fredrikaverpil.github.io/2018/03/09/official-pyside2-wheels/ 命令是:pip install --index-url=http://download.qt.io/snapshots/ci/pyside/5.9/latest/ pyside2 --trusted-host...原创 2018-07-05 18:04:04 · 9946 阅读 · 1 评论 -
在学习python爬虫过程中,遇到python2.x中使用requests时中文乱码的问题解决
最近在学习python爬虫,所用的书是《Python爬虫开发与项目实践》,作者是,范传辉,在学习第五章的时候,遇到中文乱码的情况,安装书中的代码总是乱码,自己摸索和网络搜索资料解决后,将这记录下来: 代码如下:# -*- coding: utf-8 -*from lxml import etreeimport requestsimport csvimport reimport...原创 2018-07-11 11:04:01 · 764 阅读 · 0 评论 -
python2.x 不兼容PySide2的具体原因
Developing with Qt.py https://fredrikaverpil.github.io/2016/07/25/developing-with-qt-py/python2.x 上不能执行PySide2,具体原因: Why there is no PySide2 for Python 2? Because Python 2 extensions like Py...原创 2018-07-09 19:40:51 · 2263 阅读 · 2 评论 -
python2.7.x+request+xpath爬取豆瓣电影信息
先记录一下代码#!/usr/bin/env python # -*- coding:utf-8 -*-import requestsfrom lxml import etree#1.将目标网站上的页面抓取下来headers = { 'User-Agent': "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (...原创 2018-12-06 10:17:56 · 368 阅读 · 0 评论