- 博客(26)
- 收藏
- 关注
原创 Python基础编程(三)——面向对象编程
这一章,咱们将进入一个新的部分,面向对象编程,在编程中也是很实用的一部分。在面向对象编程中,我们将编写表示现实世界中的事物和情景的类,并基于这些类来创建对象。根据类来创建对象被称为实例化 ,这让我们能够使用类的实例。面向对象编程,是将数据与函数绑定到一起,进行封装,能够减少重复代码的重写过程。一、基本概念二、创建和使用类三、封装、继承和多态四、成员保护和访问限制五、特殊成员和魔法方法一、传递任意数量的实参 Python基础部分:第一篇:Python基础
2021-02-05 22:16:15
344
1
原创 Python基础编程(二)——定义函数的操作及使用
上次我们讨论了Python的控制语句的使用和常用的基础函数,简要介绍了自定义函数def 语句的用法。这一章继续讨论def 语句定义函数的使用,以及面向对象编程。一、def 语句定义函数的使用二、面向对象编程一、def 语句定义函数的使用1.传递任意数量的实参有时,我们预先不知道函数需要接受多少个实参,好在Python允许函数从调用语句中收集任意数量的实参。def make_pizza(*toppings): """打印顾客点的所有配料""" print(toppings) make_p
2021-02-01 21:45:12
920
2
原创 Python基础编程(一)——常用的控制语句和基础函数
在平时的编程中,我们常常会用到控制语句,来执行一些有条件的命令。控制语句,通常是由条件和代码块这两部分组成的。在这个过程中,也会接触到一些常用的基础函数。下面就来简单介绍一下。一、控制语句二、Python中的几个基础函数一、控制语句控制语句,根据判断条件是** True 还是 False**,来决定接下来做什么。并将代码行作为一组,放在“代码块”中。根据代码行的缩进,可以知道代码块的开始和结束。当缩进增加时,代码块就开始了;当缩进减少为零,或者减少为外面包围代码块的缩进,就意味着代码块结束了。1
2021-01-30 22:02:44
513
1
原创 Python爬虫进阶(八)——爬虫Scrapy实战之爬取腾讯招聘信息
前面咱们介绍了scrapy框架的使用,今天就用来爬取一下腾讯招聘的职位信息。
2020-08-23 20:21:49
2012
原创 Python爬虫进阶(七)——爬虫之Scrapy初探(Ⅱ)
今天咱们继续介绍scrapy模块的使用。一、pipelines部分拓展二、Scrapy基本操作一、pipelines部分拓展上次咱们讲了管道是有优先级的,那么这次咱们继续定义一个管道,并把数字设为301,看看运行之后的效果。这里添加一个键值对,看看运行后有没有所有数据都加上了,从而验证优先级。class MyspiderPipeline: def process_item(self, item, spider): item['hello'] = 'world'
2020-08-22 18:48:48
423
原创 Python爬虫进阶(六)——爬虫之Scrapy初探(Ⅰ)
从这一章开始,咱们便进入了一个新的模块——scrapy模块,可以说,这是一个爬虫的框架,有了它,能给爬虫带来很大的方便。
2020-08-21 22:35:08
550
原创 Python爬虫进阶(五)——爬虫之多线程爬虫实战(爬取王者荣耀皮肤)
这一章,咱们通过实战来运用多线程爬虫,就来爬取目前最火的王者荣耀游戏的皮肤。
2020-08-21 15:25:54
840
原创 Python爬虫实战之 爬取王者荣耀皮肤
王者荣耀是目前非常火的一款游戏,相信大家都对其中的人物很感兴趣,那么今天就带大家来爬取王者荣耀的皮肤,可以选一款喜欢的来当电脑壁纸????。第一步,拿到url地址第二步,获取各个人物皮肤数据第三步,保存文件第四步,调用函数实现需求第一步,拿到url地址这是网站的初始url:https://pvp.qq.com/web201605/wallpaper.shtml进入网站后,通过分析,我们观察到壁纸的链接是在li标签下的a标签中:但查看网页源码发现,其中没有找到想要的链接数据,考虑接口分析
2020-08-21 13:54:36
2776
1
原创 Python爬虫初探(十)——爬虫总结
前面咱们初步了解爬虫并简单操作了一番,现在对爬虫基本过程进行一个总结。一、准备目标url分两种情况:1.页码总数明确 ,此时找到页面的规律来获取url,如百度图片。使用格式化字符的方式加入页码。2.页码总数不明确,如果url比较少可以放到列表中来遍历。通过xpath来提取页码。二、向目标的url发送请求发送请求时,我们会遇到一些反爬手段,其中最常见的就是用户代理user agent、模拟用户登陆状态cookie。另外,进行post请求时,一定要加上data表单。加上这些,一般的爬虫请求基本上就没
2020-08-06 23:48:04
344
原创 Python爬虫实战之 爬取全国理工类大学数量+数据可视化
前面两章,咱们介绍了Beautifulsoup4模块的简单用法,今天咱们就用来爬取高考各省的分数线,并简单实现一个数据可视化。
2020-08-04 22:55:25
4593
1
原创 Python爬虫初探(九)——爬虫之Beautifulsoup4实战(爬取豆瓣信息)
前面两章咱们介绍了Beautifuisoup4模块的简单使用,今天就用它来爬取豆瓣信息。话不多说,咱们开始吧。一、拿到url地址二、获取豆瓣数据三、保存文件需求: 爬取标题、评分、详情页的地址在做这些工作之前,需要提前导入好库:import requestsimport bs4from bs4 import BeautifulSoup一、拿到url地址二、获取豆瓣数据三、保存文件...
2020-08-04 12:23:07
3609
原创 Python爬虫初探(八)——爬虫之Beautifulsoup4介绍(Ⅱ)
一、遍历功能补充二、搜索树三、find_all() 和 find()四、修改文档树上一章呢,咱们讲到了bs4的遍历功能,介绍了遍历子节点。这次接着讲遍历父节点及其他的功能。一、遍历功能补充1.遍历父节点在此之前,也要先导入模块。from bs4 import BeautifulSoupimport reparent 直接获得父节点parents 获取所有的父节点还是以上一章文档为例:html_doc = """<html><head>&l
2020-07-29 15:54:17
377
原创 Python爬虫初探(七)——爬虫之Beautifulsoup4介绍(Ⅰ)
一、bs4的简介二、bs4的简单使用一、bs4的简介Beautiful Soup 是一个可以从HTML或XML文件中提取数据的网页信息提取库。跟之前介绍的xpath方法有些类似,但操作上比xpath更方便。安装方法:pip install lxmlpip install bs4二、bs4的简单使用先导入bs4模块import bs4from bs4 import BeautifulSouphtml_doc = """<html><head><title
2020-07-29 11:24:02
864
2
原创 Python爬虫初探(六)——爬虫之xpath实战(爬取高考分数线信息)
上一章我们讨论了xpath的简单使用,这次我们就来实际应用一下xpath,看看它使用有多方便。
2020-07-27 22:18:21
2377
原创 Python爬虫初探(五)——爬虫之xpath与lxml库的使用
一、xpath介绍二、xpath的使用一、xpath介绍1.基本概念XPath(XML Path Language)是一种XML的查询语言,它能在XML树状结构中寻找节点。XPath 用于在 XML 文档中通过元素和属性进行导航。xml是一种标记语法的文本格式,xpath可以方便的定位xml中的元素和其中的属性值。其中,lxml是python中的一个包,这个包中包含了将html文本转成xml对象,和对对象执行xpath的功能。2.节点的关系xml_content = '''<books
2020-07-27 17:18:45
554
原创 Python爬虫初探(四)——爬虫之正则表达式实战(爬取图片)
上一篇文章我们介绍了正则表达式的用法,这次就来实际操作一下,体会正则表达式的方便。
2020-07-27 14:36:29
2834
原创 Python爬虫初探(三)——爬虫之正则表达式介绍
一、正则表达式正则表达式(regular expression)是一种工具,是用某种自定义规则的字符串,去匹配另外的字符串是否符合这种规则。在很多场景下都用得到,如匹配电话号码、身份证号、邮箱地址、日期格式等。1.常用的一些字符1.1 匹配一次普通字符字母、数字、汉字、下划线、以及没有特殊定义的符号,都是"普通字符"。正则表达式中的普通字符,在匹配的时候,只匹配与自身相同的一个字符。例如:表达式c,在匹配字符串abcde时,匹配结果是:成功;匹配到的内容是c;匹配到的位置开始于2,结束于3。(
2020-07-20 14:48:30
842
原创 Python爬虫初探(一)——了解爬虫
一、Python爬虫介绍1.什么是爬虫?爬虫简单来说,就是代替人去模拟浏览器,进行一系列的网页操作。2.为什么需要用爬虫?为其他程序提供数据源,如搜索引擎(百度、Google等)、数据分析、大数据等等。3.企业获取数据的方式?公司自有的数据第三方平台购买的数据 (百度指数、数据堂)爬虫爬取的数据4.Python做爬虫的优势?种类特点PHP对多线程、异步支持不太好Java代码量大,代码笨重C/C++代码量大,难以编写Python支持模块多、
2020-07-16 00:27:36
780
原创 Python的要点(搭建环境、安装配置、第三方库导入方法详细过程)
一、Python语言1.Python语言的基本概念2.Python的特色3.Python的发展及应用二、搭建环境1.Python的解释器2.搭建Python环境3.Python的交互模式4.Python的第一个程序三、PyCharm的安装和配置1.PyCharm的安装2.PyCharm的配置...
2020-07-15 13:14:06
2711
原创 计算机的几大要点
一、计算机的基本概念1.计算机是一种智能的电子设备,拥有数值计算、逻辑运算、存储记忆的功能,能够按照程序执行命令,达到自动、高速运算数据的效果。2.计算机是由硬件和软件二者共同组成的。硬件看得见摸得着,如鼠标、键盘等;软件看不见也摸不着,如qq、微信等。二、计算机的语言1.计算机的语言经历三个阶段发展:机器语言→汇编语言→高级计算机语言(1)机器语言最初是由0、1组成的二进制数,这是机器...
2020-04-12 16:55:13
315
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人