
Python
小野人_vector
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于bs4库的HTML内容遍历
一、HTML基本格式本文关于HTML文档树(或者标签树)的遍历,那么HTML的基本格式是什么呢?(从别处找的两张图) 按照遍历的方向来可划分为:上行遍历、下行遍历和平行遍历,html内容中的标签都是有所属关系的(该标签包含那些标签,该标签属于哪个标签)。图中红色箭头表示下行遍历,蓝色箭头表示上行遍历,黄色箭头...原创 2020-03-06 22:11:11 · 371 阅读 · 0 评论 -
网页信息解析方法(一):利用第三方库BeautifulSoup库来处理
通过上一篇requests库的介绍Python爬虫基础—requests库,我们了解了使用Python中的第三方库requests库来获取url页面中的信息,那么获取成功后便需要对网页信息进行解析了,即筛选页面中我们需要的信息、数据并提取出来。而爬取页面的总流程可以描述为:获取页面—>解析页面,筛选和提取目标数据信息—>保存数据信息到本地。本文将对第二个环节——解析网页,筛选和提取目标...原创 2020-03-06 20:42:53 · 1318 阅读 · 0 评论 -
Python爬虫基础—requests库
之前尝试接触爬虫,比较零散也比较陌生,最近整理并再学习下。从爬虫必备库requests开始,requests库可以说是中小规模爬虫的神器,简单来说requests库主要是用来向服务器提交某些所指定url申请 并获取网页界面内容(网页内容的源代码)。如若想详细了解,可以看requests库的官方文档。requests库的安装(基于Windows操作系统,保证网络畅通) ...原创 2020-02-19 20:19:48 · 383 阅读 · 0 评论 -
Python基础—异常和面向对象
期末笔记后期整理,如有问题,请多多指教。一、异常1、所有异常类都是Exception的子类2、常见的异常 ①NameError:访问未声明的变量 ②ZeroDivisionError:除数为0 ③SyntaxError(编译时发生) ④IndexError:序列中不存在的索引 ⑤KeyError:字典中不存在的键访问值时...原创 2020-02-05 21:41:49 · 603 阅读 · 0 评论 -
Python基础—闭包和文件
期末笔记后期整理,如有问题,请多多指教。一、闭包1、三个条件: ①存在于嵌套关系的函数中; ②嵌套的内部函数引用了外部函数的变量; ③嵌套的外部函数会将内部函数名作为返回值返回。def outer(start=0): count=[start] def inner(): count[0]+=1...原创 2020-02-04 18:40:29 · 335 阅读 · 0 评论 -
Python基础—函数
期末笔记后期整理,如有问题,请多多指教。1、函数的格式:def 函数名(参数列表): #... return 表达式 #不带return相当于返回None2、函数的参数 #1.def add(a,b): print(a+b)add(11,22)#2.默认参数(位于参数列表末尾)def pinfo(nam...原创 2020-01-30 20:13:55 · 238 阅读 · 0 评论 -
Python基础—字符串、列表和字典
期末笔记后期整理,如有问题,请多多指教。有序序列:元组、列表、字符串无序序列:字典可变序列:列表、字典不可变序列:元组、字符串双向索引:元组、列表、字符串一、字符串(文本) 如:ASCII字符、各种符号、Unicode字符 1、表现方式:单引号、双引号、三引号 不能被修改,如:word[0]='m' 2、转义字符...原创 2020-01-28 18:56:46 · 298 阅读 · 0 评论 -
Python基础语法
期末笔记后期整理,如有问题,请多多指教。1、注释:分为单行注释和多行注释 Python中单行注释以#开头,多行注释用三个单引号'''或者三个双引号"""将注释括起来。# 这是一个注释print("Hello, World!")'''这是多行注释,用三个单引号这是多行注释,用三个单引号 这是多行注释,用三个单引号'''...原创 2020-01-20 10:43:43 · 165 阅读 · 0 评论