自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 关于selenium的开始

认识selenium安装安装selenium:pip install selenium==2.48.0使用selenium访问地址导入webdriver: form selenium import webdriver调用浏览器:driver =webdriver.PhantomJS(executable_path=r"selenium在你电脑上的路径\bin\selenium.exe")访问百度页面:driver.get(url=‘https://www.baidu.com/’)# 1.

2020-11-29 19:58:41 557 9

原创 这些正则你都知道吗?

匹配的边界符号含义^匹配开头$匹配结尾各种符号的表示符号含义.匹配出\n职位的任意一种字符\d匹配任意一个数字0-9,相当于[0-9]\D匹配任意一个非数字,相当于[^0-9]\w匹配任意一个数字,字母和下划线相当于[0-9a-zA-Z_]\W匹配任意一个非(数字,字母和下划线)相当于[^0-9a-zA-Z_]\s匹配任意一个空白,例如:\t,\n,\r,空格等\S匹配任意一个非空白[]匹配

2020-11-23 22:35:00 339 8

原创 Flask的开始

Flask的开始Flask介绍框架:对于同一类型的项目共性代码的封装,称为框架。Flask 是python开发编写的web框架,相较其他框架,Flask更加的轻量,灵活,但是对python代码能力要求高,Flask只提供了最基本web功能,其他功能都需要开发者自己使用python代码实现,所以,Flask项目质量是由开发者的能力决定的,但是,随着版本迭代,好多社区,组织,三方开发出了公共的Flask插件,开发者不再需要编写好多功能,转为,下载,安装使用三方插件。[外链图片转存失败,源站可能有防盗链机

2020-11-21 19:51:44 868 2

原创 爬虫的基本面试

爬虫基本的面试题在你的平时工作中,你在写爬虫的时候都遇到过什么样的反爬措施?你都是怎么解决它们的?答:Header:从用户的headers进行反爬是最常见的反爬虫策略.headers是一种区别浏览器星航和机器行为中最简单的方法,还有一些网站会对Referer(上级链接)进行检测(机器行为不太可能通过链接跳转实现)解决措施:通过审查元素或者开发者工具获取相对应的headers,然后把对应的headers传输给Python的requests,这样就能很好的绕过headers验证了IP限

2021-03-09 14:23:19 970

原创 Python pip 安装第三方库的国内镜像

清华:https://pypi.tuna.tsinghua.edu.cn/simple阿里云:http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/华中理工大学:http://pypi.hustunique.com/山东理工大学:http://pypi.sdutlinux.org/豆瓣:http://pypi.douban.com/simple/...

2021-01-28 13:09:30 207

原创 pandas的文件读取和保存

pandas的文件读取和保存一、Excel文件的读取(read_excel)pd.read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, parse_cols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, has_index_n

2021-01-05 21:04:30 2770 20

原创 numpy

numpy矩阵numpy:计算模块;主要有两种数据类型:数组和矩阵特点:运算快[]+[]1、numpy创建矩阵import numpy as npmat1 = np.mat('1 2 3;2 3 4;1 2 2')mat1print(type(mat1))<class 'numpy.matrixlib.defmatrix.matrix'>mat2 = np.mat('1 3;4 7;2 4')mat2matrix([[1, 3], [4, 7],

2020-12-30 20:37:32 1213 15

原创 初识pandas及基本的增删改查

pandaspandas1.表格数据操作;【增删改查】2.实现多个表格的处理;3.数据清洗操作: 缺失值,重复值,异常值,数据标准化,数据转换的操作;4.实现excel的特殊操作:生成透视表,交叉表;5.完成统计分析;import pandas as pdimport numpy as np一、构建dataframe创建方法一:df = pd.DataFrame(data=[['ss',20, '男','0831'],['lx',20, '女','0830'],['lx',22, '

2020-12-30 20:35:29 910

原创 数组的运算

数组的运算数组的运算:对应元素的运算,结构完全相同(1) 四则运算:+ - * / ** %import numpy as nparr1 = np.arange(1,17).reshape((4,4))# print(arr1)arr2 = np.diag([2,3,1,5]) # 创建一个对角数组# print(arr2)arr3 = arr1 * arr2 # 乘法# print(arr3)arr4 = arr2 / arr1 # 除法 被除数不能为0# print(ar

2020-12-23 17:18:49 1129

原创 redis的字符串和列表,及集合的操作

Redis安装了解Redis环境的搭建下载当前redis最新版本是4.0,它是一个测试版本,稳定版本是3.2版本。当前ubuntu虚拟机中已经安装好了redis,以下步骤可以跳过 最新稳定版本下载链接:http://download.redis.io/releases/redis-3.2.8.tar.gzstep1:下载wget http://download.redis.io/releases/redis-3.2.8.tar.gz[外链图片转存失败,源站可能有防盗链机制,建议

2020-12-11 09:05:52 572

原创 GET和POST究竟有啥不同呢?

GET和POST究竟有啥不同呢?前提[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-q69YRqTB-1605788309176)(G:\Python\typora\图片\image-20201119195346585.png)]1.当输入url之后,按下回车键发生了哪些动作?当浏览器输入url,先解析url地址是否合法.浏览器检查是否存在缓存(浏览器缓存-系统缓存-路由器缓存),如果缓存都没有,看第三步.发起Http请求前,需要进行域名解析(DNS解析),发送请

2020-11-19 20:20:12 294 9

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除