自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

转载 正则表达式复习

常用正则表达式的方法: re.compile(编译) pattern.match(从头找一个) pattern.search(找一个) pattern.findall(找所有) pattern.sub(替换)In [5]: re.findall('.','\n')Out[5]: []In [6]: re.f...

2018-12-14 22:44:00 179

转载 数据提取--JSON

什么是数据提取?  简单的来说,数据提取就是从响应中获取我们想要的数据的过程非结构化的数据:html等结构化数据:json,xml等处理方法:正则表达式、xpath处理方法:转化为python数据类型由于把json数据转化为python内建数据类型很简单,所以爬虫中,如果我们能够找到返回json数据的URL,就会尽量使用这种U...

2018-12-13 20:04:00 242

转载 分析post与json

寻找登录的post地址在form表单中寻找action对应的url地址post的数据是input标签中name的值作为键,真正的用户名密码作为值的字典,post的url地址就是action对应的url地址抓包,寻找登录的url地址勾选perserve log按钮,防止页面跳转找不到url寻找post数据,确定参数...

2018-12-13 12:02:00 281

转载 爬虫-Requests 使用入门

requests 的底层实现其实就是 urllibjson在线解析工具----------------------------------------------Linux alias命令用于设置指令的别名。 home目录中~/.bashrc 这个文件主要保存个人的一些个性化设置,如命令别名、路径等。注意:1,写绝对路径   2,有空格改好后使用s...

2018-12-07 16:59:00 213

转载 爬虫基础知识

HTTP 超文本传输协议 默认端口号:80HTTPS HTTP + SSL(安全套接字层) 默认端口号:443HTTPS比HTTP更安全,但是性能更低HTTP常见请求头1. Host (主机和端口号)2. Connection (链接类型)3. Upgrade-Insecure-Reques...

2018-12-07 16:13:00 167

转载 str和byte的区别

bytes1、bytes对象只负责以二进制字节序列的形式记录所需记录的对象,至于该对象到底表示什么(比如到底是什么字符)则由相应的编码格式解码所决定2、bytes是Python 3中特有的,Python 2 里不区分bytes和str。3、python3中:  str 使用encode方法转化为 bytes  bytes通过decode转化为str4、在Python 2中...

2018-12-07 14:22:00 429

转载 pycharm中使用配置好的virtualenv环境,自动生成和安装requirements.txt依赖

1、手动建立:第一步 建立虚拟环境Windows cmd:pip install virtualenv创建虚拟环境目录 env激活虚拟环境C:\Python27\Scripts\env\Scripts>activate.batLinux:启动虚拟环境:source env/bin/activate...

2018-12-05 23:03:00 694

转载 gitbook新版本"gitbook build"命令导出的html不能跳转的解决办法

使用的是win7系统,gitbook新版本不支持html跳转功能,所以要降版本至2.6.7解决办法如下:第一步:生成时指定gitbook的版本, 本地没有会先下载gitbook build --gitbook=2.6.7可能会报错,如下操作:列出本地所有的gitbook版本gitbook ls卸载对应的gitbook版本(下的新版本...

2018-10-31 11:49:00 695

转载 学无止境,我爱python

每天更新....python基础python字符编码python基础数据类型python列表、元组python字典python字符编码unicode,utf-8,asciipython深浅拷贝python文件读取python--初识函数python函数本质与闭包python-装饰器python-带能数的装饰器python--迭代器p...

2018-01-07 21:00:00 291

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除