
Python之从入门到精通 + 网页爬虫实战
致力于以最简洁通俗易懂的方式来引导所有Python初学者,做最好的Python入门教程
源代码•宸
我们终此一生,就是要摆脱他人的期待,找到真正的自己
展开
-
爬虫Python带我旅行带我飞,带我省钱带我浪——张家界短租
首先了解网页观察是IT从业人员的基本素质通过翻页可以发现这是个静态网页,只要改变p后面的值就可以到对应的页面纯粹HTML格式的网页通常被称为静态网页,在网络爬虫中,静态网页的数据比较容易获取,因为所有数据都呈现在网页的HTML代码中。相对而言,使用AJAX动态加载网页的数据不一定会出现在HTML代码中,这就给爬虫增加了困难预备知识1、BeautifulSoup可以从HTML或XML文件中提取数据。根据其官方文档的描述,Beautiful Soup可以提供一些简单的、Python式的函数用来原创 2020-08-13 23:43:35 · 408 阅读 · 0 评论 -
用蟒蛇抓取豆瓣电影数据(初级版)
考虑到马上就要开学了,趁着最后一点时间好好浪一浪,康康还有哪些电影没看的,抓紧时间呐,开学后可就不好玩了首先还是观察网页结构,大多网页基本都是静态网页,可以随意更改start=后的数字得到目的网页,比方说我输入50通过观察可发现一个网页里就只有25个电影,所以总共就有10个这样的网页,那就用for循环把它们爬下来就行了user-agent用来伪装自己,在get_movies函数内建一个movie列表用来存取每次爬到的数据用request函数请求得网页然后做一锅汤解析网页,然后用find_all原创 2020-08-13 15:46:26 · 323 阅读 · 0 评论 -
2020Python程序设计基础(山东联盟)章节测试满分答案
希望大家做完之后用这个来对答案而不是抄答案,祝各位个个满分!绪论第一章第二章第三章第四章第五章第六章第七章第八章第九章第十章第十一章第十二章答案持续更新中……如果喜欢我的文章,请记得一键三连哦,点赞关注收藏,你的每一个赞每一份关注每一次收藏都将是我前进路上的无限动力 !!!↖(▔▽▔)↗感谢支持...原创 2021-01-16 10:33:28 · 4829 阅读 · 5 评论 -
Python疫起学习·万丈高楼平地起Day10(精简版|浓缩就是精华)面向对象程序设计OOP以及标准库中其他常用数据类型附上机器人实例
二十四、面向对象程序设计OOP(Object Oriented Programming)创建类时用变量形式表示对象特征的成员称为数据成员,用函数形式表示对象行为的成员称为成员方法,数据成员和成员方法统称为类的成员。在Python中一切皆对象,函数也是对象,类也是对象,请看下面的代码:对象有“属性”和“方法”。“属性”就是描述这个对象的各种标签,“方法”就是这个对象可以做的动作。现在看这篇博客...原创 2020-04-26 11:45:08 · 346 阅读 · 0 评论 -
Python疫起学习·万丈高楼平地起Day09(精简版|浓缩就是精华)爬虫知识附上案例爬取北京地区短租房信息、爬取酷狗TOP500的数据以及爬取网易云音乐热歌榜单
爬虫知识Requests库部分运行结果如下:有时爬虫需要加入请求头来伪装成浏览器,以便更好地抓取数据。在Chrome浏览器中按F12键打开Chrome开发者工具,刷新网页后找到User-Agent进行复制,如图请求头的使用方法:Requests库不仅有get()方法,还有post()等方法。post()方法用于提交表单来爬取需要登录才能获得数据的网站,这部分内容会在后面学习,这...原创 2020-04-26 07:33:30 · 748 阅读 · 0 评论 -
Python疫起学习·万丈高楼平地起Day08(精简版|浓缩就是精华)函数知识点附上输出菱形图形案例、模拟最终成绩计算过程案例
二十三、函数所谓函数,就是一套定义好的流程在一个Python工程中,应该保证每个函数的名字唯一。函数体就是这个函数需要执行的一系列操作。操作可能只有一行,也可能有很多行。一个函数只做一件事情,Python编码规范建议一个函数的函数体不超过20行代码。如果超过了,说明这个函数做了不止一件事情,就应该把这个函数拆分为更小的函数。这也就暗示了在函数体里面也可以调用其他的函数。设计函数时要提高模...原创 2020-04-24 17:48:15 · 295 阅读 · 0 评论 -
Python疫起学习·万丈高楼平地起Day07(精简版|浓缩就是精华)集合、程序控制结构知识点附上鸡兔同笼问题以及时间库终结
二十一、集合原创 2020-04-23 22:03:27 · 344 阅读 · 0 评论 -
Python疫起学习·万丈高楼平地起Day06(精简版|浓缩就是精华)元组字典知识点-内附玩转时间库案例
十九、元组元组创建与元素访问:之前我也强调过,如果元组中只有一个元素,则必须在最后增加一个逗号!!!除了上述的方法直接创建元组外,很多内置函数的返回值也包含了若干元组的可迭代对象,e.g. enumerate()、zip()等元组与列表的异同点同:都属于有序序列异:元组是不可变序列,不可直接修改元组中元素的值。可以认为元组是常量列表,但访问速度比列表快,可是若元组中包含可变序列,...原创 2020-04-21 14:19:00 · 295 阅读 · 0 评论 -
Python疫起学习·万丈高楼平地起Day05(精简版|浓缩就是精华)列表知识点终结版(附上成绩评测小程序)
内置函数对列表的操作max()、min()返回列表所有元素最大最小值,sum()求和,len()返回列表元素个数,zip()函数用于将多个列表中元素重新组合为元组并返回这些元组的zip对象,enumerate()返回包含若干下标和值的迭代对象,map()把函数映射到列表上的每个元素,filter()函数根据指定函数返回值对列表元素进行过滤,all()用来测试列表中是否所有元素都等价于True,a...原创 2020-03-26 10:12:14 · 278 阅读 · 1 评论 -
Python疫起学习·万丈高楼平地起Day04(精简版|浓缩就是精华)列表&随机分配办公人员&商品购物
列表元素访问可使用整数作为下标进行访问十四、列表常用方法1)增——append()、insert()、extend()append()向列表尾部追加一个元素,insert()用于向列表任意指定位置插入一个元素,extend()将另一个列表中所有元素追加至当前列表的尾部这里展示一下append()和extend()的不同处2)删——pop()、remove()、clear()p...原创 2020-03-25 08:21:54 · 251 阅读 · 0 评论 -
Python疫起学习·万丈高楼平地起Day03(精简版|浓缩就是精华)列表&九九乘法表
十、浅谈map()、reduce()和filter()这里要注意一点,reduce()不是内置函数,而是放在标准库functools中,需要先导入再使用内置函数map()把一个函数func依次映射到序列或迭代器对象的每个元素上,并返回一个可迭代的map对象作为结果,map()函数不对原序列或迭代器对象做任何修改...原创 2020-03-24 10:36:41 · 244 阅读 · 0 评论 -
Python疫起学习·万丈高楼平地起Day02(精简版|浓缩就是精华)内含一个Python小游戏石头剪刀布
Python之禅原创 2020-03-23 15:03:41 · 307 阅读 · 0 评论 -
Python疫起学习·万丈高楼平地起Day01(精简版|浓缩就是精华)内附两行代码解决某数字各个位数字,计算三角形第三边长
对象是Python中最基本的概念之一,在Python中一切皆对象对象由数据和行为两个部分组成,而行为主要通过方法来实现,通过一些特殊方法的重写可以实现运算符重载。这里有整数、实数、复数、字符串、列表、元组、字典、集合还有zip、map、enumerate、filter等对象,这里我有一点要强调一下,元组中如果只有一个元素的话,后面的逗号不能省略。如果对元组不熟悉,没关系,我会在接下来的专栏里详细介绍的,包学包会!原创 2020-03-20 20:57:28 · 745 阅读 · 0 评论