
python
不屑哥
这个作者很懒,什么都没留下…
展开
-
windows安装lxml库
原文:https://jingyan.baidu.com/article/ad310e80feaac71849f49e98.htmlpip install lxml。如果安装成功的话,可以不用往下看了,人品太好了。通常呢,都会遇到各种错误,不是这不对,就是那里错,反正就是各种安装不了。所以直接手动安装库更好1、查看python版本我这里是python3.72、打开cmd,输入pip3 instal...原创 2018-05-02 17:25:45 · 19807 阅读 · 8 评论 -
selenium WebDriverException: Message: unknown error: DevToolsActivePort file doesn't exist
原文:https://blog.youkuaiyun.com/lilongsy/article/details/80680071报错环境: CentOS7.5 Python 3.6.5 chromedriver_linux64 2.40 Selenium Google Chrome 67 使用Selenium和Chrome,报如下错误:File "/usr/local/anacond...转载 2018-07-16 20:36:10 · 7918 阅读 · 0 评论 -
Centos7安装chrome浏览器
原文:https://blog.youkuaiyun.com/u010472499/article/details/723279631. 配置yum源在目录 /etc/yum.repos.d/ 下新建文件 google-chrome.repocd /etc/yum.repos.d/vim google-chrome.repo1 2写入如下内容:[google-chrome]na...转载 2018-07-16 20:38:24 · 1556 阅读 · 1 评论 -
Scrapy+ChromeDriver+Selenium爬取动态html页面
原文:https://blog.youkuaiyun.com/qq_30242609/article/details/70859891Headless组件ChromeDriverselenium3.x已经不支持PhantomJS,所以可以使用firifox或者chrome的headless方案SeleniumSelenium是一个自动化的测试工具,这里主要用到了它的Webdriver操作浏览器。python下...转载 2018-06-29 10:36:16 · 9508 阅读 · 3 评论 -
利用anaconda安装scrapy
报错RequestsDependencyWarning: urllib3 (1.26.7) or chardet (3.0.4) doesn‘t match a suppor。从_init__.py:91包的源码提示里面看到报错,指定的版本号,就是urllib3和chardet的版本不兼容。解决,卸载urllib3,安装匹配的版本。原创 2018-07-13 11:41:26 · 986 阅读 · 0 评论 -
window下'scrapyd-deploy' 不是内部或外部命令,也不是可运行的程序
原文:https://www.cnblogs.com/vendy/p/5653192.html在windows上使用scrapyd-client安装后,并不能使用相应的命令'scrapyd-deploy' 需要在"C:\Python27\Scripts" 目录下 增加scrapyd-deploy.bat文件内容填充为:@echo off"C:\python27\python.exe" "C:\...转载 2018-07-13 18:31:47 · 2308 阅读 · 0 评论 -
window下scrapyd部署
原文:https://blog.youkuaiyun.com/xiaoquantouer/article/details/53164306一、前言由于毕设要做一个集成爬虫、文本分析和可视化的网站。需要将爬虫部署到网站上去供不懂技术的人使用。因此开始了研究scrapy+django。找了多方面的资料终于找到了我想要的,那就是scrapyd。网站通过http就可以从scrapyd上管理后台的爬虫了。 ...转载 2018-07-13 18:49:39 · 1717 阅读 · 0 评论 -
win7利用opencv训练自己的xml文件
参考:https://www.jianshu.com/p/0afa9712c6d5https://www.jianshu.com/p/e35260f7cbf0?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendationhttps://blog.csd...转载 2018-08-10 18:21:09 · 3291 阅读 · 2 评论 -
Python环境搭建之OpenCV
原文:https://www.cnblogs.com/lclblack/p/6377710.htmlPython环境搭建之OpenCV一、openCV介绍 Open Source Computer Vision Library.OpenCV于1999年由Intel建立,如今由Willow Garage提供支持。OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行...转载 2018-08-14 10:40:17 · 410 阅读 · 0 评论 -
module 'cv2.cv2' has no attribute 'xfeatures2d'
原文:https://blog.youkuaiyun.com/github_38236333/article/details/78781210**原因:**3.X以后OpenCv只包含部分内容,需要神经网络或者其他的函数需要导入opencv_contrib解决方法:pip install opencv-contrib-python1注意: 如果已经安装OpenCv2,则需要先卸载pip ...转载 2018-08-20 20:39:06 · 5498 阅读 · 0 评论 -
Anaconda dlib安装
到这里下载wheelhttps://pypi.org/simple/dlib/ 下载whl后,命令行用pip安装whl前提是必须要下载正确的whl,例如pyhont版本,平台这里cp36就是python3.6,win64平台pip install dlib-19.8.1-cp36-cp36m-win_amd64.whl ...转载 2018-09-11 16:52:52 · 6271 阅读 · 0 评论 -
Scrapy读取设置文件(settings.py)
原文:https://blog.youkuaiyun.com/sinat_36899414/article/details/78076852python 3.x1、引入from scrapy.utils.project import get_project_settings2、利用get_project_settings()读取settings.py中的属性在middlewares.py文件中...转载 2018-11-26 11:26:29 · 3639 阅读 · 1 评论 -
修改pycharm的运行内存避免循环运行python导致内存不足
原文:https://blog.youkuaiyun.com/u010801439/article/details/80020649编辑PyCharm安装目录下PyCharm 4.5.3\bin下的pycharm.exe.vmoptions文件, 如下-Xms128m-Xmx768m-XX:ReservedCodeCacheSize=240m-XX:+UseConcMarkSweepGC-X...转载 2018-11-29 10:23:25 · 16204 阅读 · 0 评论 -
scrapyd修改配置
原文:https://segmentfault.com/a/1190000004970228因为本人使用anaconda管理python库,所以python的库文件都在anaconda目录下查找scrapyd的路径find / -name scrapyd查到两个结果,一个是scrapyd的执行程序一个是scrapyd的库文件修改scrapyd的配置,修改成允许远程...转载 2018-07-16 19:30:08 · 4763 阅读 · 0 评论 -
CentOS7下安装python-pip
原文:https://blog.youkuaiyun.com/yulei_qq/article/details/529843341、首先检查linux有没有安装python-pip包,直接执行 yum install python-pip2、没有python-pip包就执行命令 yum -y install epel-release(3)、执行成功之后,再次执行yum install python-pip(4...转载 2018-07-02 11:58:31 · 451 阅读 · 0 评论 -
PyCharm配置project
前提先安装python运行环境1、打开设置2、指定python的虚拟机路径3、它会自动搜索python环境的位置按ok即可原创 2018-05-06 03:01:24 · 9482 阅读 · 0 评论 -
PyCharm配置svn报错
Cannot run program "svn" (in directory "D:\开发\python_work"): CreateProcess error=2, 系统PyCharm是使用svn命令行功能提交代码的,而乌龟默认是没有安装命令行客户端工具的,所以要乌龟运行,点击修改,安装命令行客户端然后PyCharm里面指定svn.exe的路径即可打开PyCharm的setting设置修改svn...原创 2018-04-28 14:31:57 · 3197 阅读 · 0 评论 -
解决Requests中文乱码
python 3.7原文(相当详细):https://blog.youkuaiyun.com/chaowanghn/article/details/54889835方法1:使用r.content,得到的是bytes型,再转为strurl='http://music.baidu.com'r = requests.get(url)html=r.contenthtml_doc=str(html,'utf-8'...转载 2018-05-14 16:40:49 · 3958 阅读 · 0 评论 -
Selenium3+python自动化66-Chrome您使用的是不受支持的命令行标记:--ignore-certificate-errors
转自:https://www.cnblogs.com/yoyoketang/p/6789537.html?utm_source=itdadao&utm_medium=referralchromedriver下载页:http://chromedriver.storage.googleapis.com/index.html本人随便点击下载了个chromedriver,然后python运行Sel...转载 2018-05-25 16:22:13 · 1788 阅读 · 0 评论 -
selenium+python headless访问网页
最近学python爬虫,发现请求的页面如果是内容是异步加载的,则没办法用BeautifulSoup这些库爬取异步加载的数据。selenium是自动化测试工具,可以调用浏览器加载页面数据(包括异步加载的数据),通过selenium可以很便捷爬取页面所有信息先下载python的selenium库pip install selenium1、selenium+phantomjs(已夭折)官网:http:/...原创 2018-05-25 17:15:26 · 14161 阅读 · 1 评论 -
pycharm打开、执行调试scrapy程序
原文:http://www.jb51.net/article/129346.htmpycharm下打开、执行并调试scrapy爬虫程序的方法转载 更新时间:2017年11月29日 11:05:30 作者:轰_HONG 我要评论本篇文章主要介绍了pycharm下打开、执行并调试scrapy爬虫程序的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧首先得有一...转载 2018-06-05 17:10:40 · 1883 阅读 · 0 评论 -
利用anaconda作为python的依赖库管理
python自带的pip管理依赖库太麻烦,pip很多库不存在,或者一些库并不支持window系统。而且每次用pip下载库经常不成功,结果还是要手动下载跟自己python对应的whl包安装库。遇到了很多坑之后,发现神奇anaconda,便查阅资料,整理好记录到这里1、下载anacondaanaconda可以提供了python的很多库管理,支持多个系统下载地址:https://www.anaconda...原创 2018-06-05 14:46:39 · 5235 阅读 · 0 评论 -
scrapy中修改爬取数据的输出编码为utf-8
本人是scrapy1.5版本在scrapy的settings.py文件中添加如下设置# 修改编码为utf-8FEED_EXPORT_ENCODING = 'utf-8'旧的版本可能不行转载 2018-06-05 18:09:12 · 9947 阅读 · 3 评论 -
anaconda安装scrapy后运行报错ImportError: DLL load failed: 操作系统无法运行 %1。
本人在win7下没问题,win10才有问题转自:https://tennc.github.io/2016/09/30/anaconda-install-scrapy-tips/安装了anaconda后,也成功安装了scrapy,但是到scrapy新建项目时,直接报错。错误如下:12from cryptography.hazmat.bindings._openssl import ffi, libI...转载 2018-06-06 00:31:39 · 2247 阅读 · 0 评论 -
scrapy利用xpath抓取数据的值有\r\n\t
原文:https://www.cnblogs.com/VseYoung/p/8689171.html利用normalize-space 函数 (XPath)即可item['time'] = sel.xpath('normalize-space(./span[4]/span[1]//text())').extract()把xpath表达式作为normalize-space()函数的参数...转载 2018-06-06 17:24:44 · 6446 阅读 · 4 评论 -
Python几种主流框架
转自:https://zhidao.baidu.com/question/1047367767941211939.html从GitHub中整理出的15个最受欢迎的Python开源框架。这些框架包括事件I/O,OLAP,Web开发,高性能网络通信,测试,爬虫等。Django: Python Web应用开发框架 Django 应该是最出名的Python框架,GAE甚至Erlang都有框架受它影响...转载 2018-05-31 19:50:25 · 7591 阅读 · 0 评论 -
python操作hdfs
原文:https://www.cnblogs.com/Jims2016/p/8047914.html可以使用python的hdfs库(资料https://pypi.org/project/hdfs/),pip下载即可# !coding:utf-8import sysfrom hdfs.client import Client# 关于python操作hdfs的API可以查看官网...原创 2018-06-29 17:24:02 · 19900 阅读 · 0 评论 -
scrapy中如何设置应用cookies
原文:https://blog.youkuaiyun.com/Thoms_/article/details/82977036本人是python3.6总的来说,scrapy框架中设置cookie有三种方式。第一种:setting文件中设置cookie当COOKIES_ENABLED是注释的时候scrapy默认没有开启cookie当COOKIES_ENABLED没有注释设置为False的时候s...原创 2020-06-11 22:22:54 · 33597 阅读 · 8 评论