
python
pp_lan
这个作者很懒,什么都没留下…
展开
-
nohup执行python程序日志不输出
问题表象:程序中对象全打印出来的时候可以有日志,但是只打印数据条数,没有日志问题原因:python的print输出有缓存,默认开启。导致日志较少的时候第一时间不输出问题解决:添加 -u参数,关闭缓存。示例:nohup python -u spider/test.py >test.log 2>&1 &...原创 2020-11-12 15:53:28 · 2243 阅读 · 0 评论 -
scrapy模拟点击
lua_click = '''function main(splash, args)assert(splash:go(args.url))assert(splash:wait(0.5))local form = splash:select('#buttonId')form:click()splash:wait(2)return { html = splash:html(),...转载 2019-12-06 18:49:18 · 2719 阅读 · 0 评论 -
conda环境管理
查看环境conda env list创建环境conda create -n python36 python=3.6进入环境source activate python36activate python36 # windows下搜索包conda search mxnet*指定环境,查看已安装的包conda list -n python36指定环境,安装指定版本的包...转载 2019-11-01 10:40:45 · 132 阅读 · 0 评论 -
scrapy框架使用splash出现raise ValueError('Missing scheme in request url: %s' % self._url)
今天在写一个爬虫demo的时候出现如下错误:raise ValueError('Missing scheme in request url: %s' % self._url)按照字面意思便是URL有问题,缺少scheme, 于是边检查请求的url,但是反复确认后发现请求地址正常的,而且有'http:'的头,经过反复检查,终于发现原因:由于我使用了splash进行渲染,配置splash地...原创 2019-10-26 17:39:16 · 737 阅读 · 0 评论 -
正则使用记录
汉字:[\u4e00-\u9fa5]+float: [-?0-9.?]+正整数:[0-9]+字母: [a-zA-Z]+python使用:import reprint(re.search("[-?0-9.?]+", "你好,金额为:-123.5。").group())notepad使用:后面的数据从文件解析,填入,一个一个填写太麻烦可以借用note...原创 2019-10-25 10:42:21 · 100 阅读 · 0 评论 -
图片抓取【scrapy、splash】
环境说明:使用了爬虫框架scrapy, 并通过splash进行渲染(不然爬虫使用过程中,很多网站异步加载的情况下是无法抓取内容的)。scrapy框架安装(直接下载离线安装即可)【https://blog.youkuaiyun.com/pp_lan/article/details/90642614】splash安装(过程比较麻烦)【https://blog.youkuaiyun.com/pp_lan/ar...原创 2019-10-18 10:38:03 · 318 阅读 · 0 评论 -
flask获取不到参数
flask中对于 GET和POST的请求参数获取方式不同:if request.method == "POST": title = request.form.get("title")else: title= request.args.get("title")原创 2019-06-13 16:36:55 · 2305 阅读 · 1 评论 -
dataframe常用操作
1. 数组转dataframeimport pandas as pdinput = [{"trainModelName": "东南 V6菱仕", "BaseModelName": "东南 V6菱仕", "label": "0"}, {"trainModelName": "福特 经典全顺 ", "BaseModelName": "福特 经典全顺", ...原创 2019-06-13 14:45:29 · 655 阅读 · 0 评论 -
No module named win32api
链接:https://www.cnblogs.com/SH170706/p/9640110.html原创 2019-05-28 17:16:37 · 180 阅读 · 0 评论 -
scrapy安装
scrapy安装需要首先安装twisted否则会报出如下错误Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools"解决方案:1.http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted下载twisted对应版本的whl文...原创 2019-05-28 16:55:41 · 162 阅读 · 0 评论 -
Splash安装踩坑(Win10)
1. 下载docker参考链接:http://mirrors.aliyun.com/docker-toolbox/windows/docker-toolbox/2. 按步骤安装3. 使用管理员权限打开Docker Quickstart Terminal,如果已经安装了Git,修改为本机git路径3. 镜像无法下载到github搜索boot2docker项目找到iso...原创 2019-05-30 10:28:46 · 2157 阅读 · 0 评论