自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 2021-08-18

python报错 ScrapyDeprecationWarning: scrapy.loader.processors.MapCompose is deprecated, instantiate itemloaders.processors.MapCompose instead. 解决方法:在报错的文件下加入以下打码,就可以忽略 import warnings warnings.filterwarnings("ignore") 该方法源码 def filterwarnings(action, messag

2021-08-18 15:25:52 766

原创 安卓手机App反编译

安卓手机App反编译 jadx 下载:https://github.com/skylot/jadx 里面有详细的操作步骤 在使用的过程发现导出文件一直卡死,直接用命令行导出,报错。。。。 尝试解决,还是不行,修改参数失败,所有换工作 dex2jar + jd-gui dex2jar 下载:https://sourceforge.net/projects/dex2jar/ 解压安装即可 jd-gui...

2019-07-12 17:57:20 1492

原创 crontab定时启动scrapy爬虫

部署到测试环境,并设置定时启动任务 通过FileZille工具,将本地的文件上传到测试服务器上面的python文件夹中 在与spider同级目录下写一个shell脚本,启动所编辑的运行爬虫文件 vi run.sh 1 #! /bin/sh 2 export PATH=$PATH:/usr/local/bin 3 cd /data/project/python/...../run...

2019-05-22 14:00:58 635 1

原创 python统计list中个元素出现次数

利用字典统计 利用pandas统计 利用Counter类统计 1:方法一 data = [1,2,3,4,2,3,4,2,3,4,5,6,6,4,4,5,6,7,4] data_dict = {} for key in data: data_dict[key] = data_dict.get(key,0) + 1 print("data_dict:",data_dict) 输出结果: d...

2019-04-12 10:47:56 11625

原创 Jupyter Notebook设置代码自动补全

Jupyter Notebook设置代码自动补全 1:已经下载安装Jupyter 2:在命令行中输入 python -m pip install jupyter_contrib_nbextensions 3: jupyter contrib nbextension install --user 4:重启jupyter jupyter notebook 此时Nbextensions宽展键已经...

2019-04-12 09:42:19 2759

原创 安装scrapy

**python环境** --判断是否安装scrapy --- import scrapy(如果不能导入成功,说明还未安装) #正式安装scrapy框架(同时也需要安装一些scrapy所依赖的第三方库)# 1:pip install wheel 2:lxml 3: PyOpenssl 4: Pywin32 5:pip install scrapy **...

2019-03-27 16:19:23 177

原创 python基础 ---1

#调用python脚本 python script.py (script.py python脚本的文件名) #python文件中如果未指定编码,执行的时候可能会报错 #以双下划线开头的__foo代表类的私有成员,以双下划线开头和结尾的__foo__代表python里特殊方法专用的标识 #python最具有特色的就是用缩进来写模块 #三引号 “”"""" 可以表示由多行组成,编写多行文本的快捷语...

2019-03-19 18:07:10 165

原创 抓取的网站需要登录,才能采集网站信息

scrapy采集需要登录的网站信息 直接登录网站,鼠标右键–检查,或者直接键盘F12,找到cookie值,此时的cookie是已经登录之后的cookie,将其转化为字典的格式 下面这段代码可以将网页中的cookie值直接转化成字典格式: class DictCookie: def __init__(self, cookie): self.cookie = cookie ...

2019-03-01 16:34:33 2051

原创 python虚拟环境迁移

生成虚拟环境: pip freeze > requirement.txt 安装虚拟环境: pip install -r requirement.txt

2019-02-26 11:30:59 393

原创 selenium模拟登陆

以模拟登陆csdn账号为例: import time from selenium import webdriver (创建谷歌浏览器对象) driver = webdriver.Chrome(r"下载的webdriver本地地址") driver.get(‘https://passport.youkuaiyun.com/account/login’) driver.find_element_by_xpath(...

2019-02-20 16:34:06 544

原创 windows系统下利用scrapyd部署爬虫(scrapy)项目

1:首先python环境已经配置好 2:然后准备一个可以支持scrapy项目运行的虚拟环境,我再本地安装了python3 和Anaconda a:mkvirtualenv --D:\python\Anaconda\anaconda–tool\python.exe env(虚拟环境名称) b:然后进入虚拟环境下载安装scrapyd,和scrapyd-client两个包 3:进行部署 a:在虚拟环...

2018-12-29 14:52:02 554

原创 selenium模拟滑动浏览器有无界面

from selenium import webdriver ‘’‘无界面浏览器’’’ chrome_options = webdriver.ChromeOptions() chrome_options.add_argument(’–headless’) browser = webdriver.Chrome(r“chromedriver.exe保存路径",chrome_options=chrome...

2018-11-15 14:35:44 454

原创 django项目开发基本步骤

Django开发项目的过程 [ ] –下载安装第三方库 pip install django==相应的版本 –创建项目 admin-django startproject projcet (project是你创建的项目名称,可以自己设置) –创建好之后输入tree命令会显示django自动生成的相关目录 —–project...

2018-07-05 17:51:11 318

原创 Git 使用

git分布式版本控制系统linux系统中git常见命令:开始一个工作区(参见:git help tutorial)   clone      克隆一个仓库到一个新目录   init       创建一个空的 Git 仓库或重新初始化一个已存在的仓库在当前变更上工作(参见:git help everyday)   add        添加文件内容至索引   mv         移动或重命名一个文...

2018-05-22 17:46:45 167

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除