- 博客(11)
- 收藏
- 关注
原创 网页爬虫知识点总结
网页爬虫知识点总结 1.什么是爬虫? 爬虫就是:模拟浏览器发送请求,获取响应 2.爬虫的分类,爬虫的流程 聚焦爬虫:针对特定的网站的爬虫 准备url地址 -->发送请求 获取响应–> 提取数据–> 保存 获取响应–> 提取url地址,继续请求 通用爬虫:搜索引擎的爬虫 抓取网页–> 数据存储–>预处理–> 提供检索服务,网站排名 3.浏览器发送请求的过程 爬虫请求的:url地址对应的响应 浏览器获取到的内容:elements的内容=url对应的响
2021-02-09 21:01:56
1175
原创 python常见系统模块
常见系统模块 为了方便程序员开发代码,Python提供了很多内置的模块给程序员用来提高编码效率。常见的内置模块有: os模块 sys模块 math模块 random模块 datetime模块 time模块 calendar模块 hashlib模块 hmac模块 copy模块 uuid模块 OS模块 OS全称OperationSystem,即操作系统模块,这个模块可以用来操作系统的功能,并且实现跨平台操作。 import os os.getcwd() # 获取当前的工作目录,即当前python脚本工作的
2020-12-23 09:02:12
2581
原创 比较运算符,逻辑运算符,位运算符,运算符优先级
比较运算符 以下假设变量a为10,变量b为20: 运算符 描述 实例 == 等于 - 比较对象是否相等 (a == b) 返回 False. != 不等于 - 比较两个对象是否不相等 (a != b) 返回 true. <> 不等于 - 比较两个对象是否不相等 (a <> b) 返回 true。这个运算符类似 != 。 > 大于 - 返回x是否大于y (a > b) 返回 False。 < 小于 - 返回x是否小于y。所有比较运算符返
2020-12-12 16:08:11
9366
原创 算数运算符and赋值运算符
算数运算符 运算符 描述 实例 + 加 两个对象相加 a + b 输出结果 30 - 减 得到负数或是一个数减去另一个数 a - b 输出结果 -10 * 乘 两个数相乘或是返回一个被重复若干次的字符串 a * b 输出结果 200 / 除 b / a 输出结果 2 // 取整除 返回商的整数部分 9//2 输出结果 4 , 9.0//2.0 输出结果 4.0 % 取余 返回除法的余数 b % a 输出结果 0 ** 指数 a**b 为10的20次方, 输出结果 10
2020-12-11 20:37:15
2119
原创 进制,进制转换,数据类型转换
进制 现代的计算机和依赖计算机的设备里都用到二进制(即0和1)来保存和表示数据,一个二进制表示一个比特(Bit)。 在二进制的基础上,计算机还支持八进制和十六进制这两种进制。 除了计算机里的进制以外,我们生活中经常用到的是十进制。 Python语言支持二进制、八进制、十六进制以及十进制的数字表示。 a=20 # 默认为十进制 b = 0b11101 # 以0b或0B开头的数字是二进制 c = 0o12 # 以 0o或0O开头的数字是八进制 d = 0x1A # 以 0x或0X开头的数字是十
2020-12-11 20:14:44
1918
原创 创建虚拟环境过程(简易版)
创建虚拟环境过程(简易版) 按win+R输入cmd进入管理器 安装virtualenvwrapper pip install virtualenvwrapper-win 创建虚拟环境 创建一个名为qzw的虚拟环境 mkvirtualenv qzw 默认创建完成后就直接进入了该虚拟环境 会在目录前有括号括起来表示 退出当前虚拟环境 deactivate 这样就退出了该虚拟环境 如果你电脑中安装了python2和python3,并且两个版本中都安装了virtualenvwrapper,那么将会使
2020-12-01 19:41:06
683
原创 linux文本编辑器
linux常见服务 linux配置环境 apt-get update apt-get upgrade apt-get install screen screen -S lnmp https://lnmp.org/install.html wget http://soft.vpser.net/lnmp/lnmp1.7.tar.gz -cO lnmp1.7.tar.gz && tar zxf lnmp1.7.tar.gz && cd lnmp1.7 && ./i
2020-11-30 20:09:22
265
原创 Python操作 Excel 基础操作
Python操作 Excel 安装 读取 Excel pip install xlrd read 写入Excel pip install xlwt write 补充会用到的excel表 读取 Excel import xlrd myexcel = xlrd.open_workbook('files/test.xlsx') mysheetname = myexcel.sheet_names() print(mysheetname) 获取 sheet 一个Excel可以有多个 sh
2020-11-26 19:37:04
5557
1
原创 turtle的使用以及画小黄人
turtle的使用 在使用turtle之前需要导入turtle库 导入方式如下: import turtle 以下是在使用turtle的时候一些常用代码: # 创建画布 turtle.setup(888,888) turtle.hideturtle() # 设置笔 turtle.pencolor('orange') #修改笔的颜色(默认是黑色) # 设置线条的宽细 turtle.width(3) # 设置笔的移动速度 1~10由慢及快 0最快 turtle.speed(2) # 移动笔 # 前进
2020-11-24 19:38:46
1316
2
原创 python的下载及安装方法
python-3.7.6-amd64的安装方法 进入官网:https://www.python.org 如图找到All releases点击进入 然后找到想要下载的版本进行下载点击Download (如图我想下载Python3.7.6) 下载完后双击打开点击安装(如图) 第一个是自动创建新文档安装目录 第二个是自定义安装目录 然后如图在第二个选项上打勾 然后点击第二个 直接点击Next 这里全选 然后如图选择安装目录 点击Install安装 安装完成后点击Clos
2020-11-23 17:56:41
1816
原创 第一个markdown文件-----------markdown的使用方法
markdown的使用方法 我的第一个markdown笔记 后缀名是md md就是markdown简称 开头输入一个>符号回车形成引用 回车两下表示下一排引用 回车两下表示结束引用 表示二级引用(二级引用则输入两个>>) (该排表示引用结束) 二级标题(开始两个# 回车) 无需列表 无序列表输入*+空格生成 大大 回车+TAB 回车 回车 三级标题(三级标题是三个#然后回车)后续标题同理 有序列表(数字1+.+空格) 回车 四级标题
2020-11-23 16:33:38
347
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅