Python 实战 !!!
文章平均质量分 96
一个简短且非常好记的ID
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python中不得不知道的:迭代器与生成器理解,最简单易懂的版本
什么是可迭代对象 最直观的理解就是可以被for in 循环的对象,例如字符串,字典,列表,元组,集合等, 用另一句话来说就是实现了__iter__ 方法的就是可迭代对象(__iter__方法是python内置方法,用于返回迭代器自身) 什么是迭代器 迭代器就是一个实现了迭代方法的容器,他是一个带状态的对象,他能在你调用next的时候返回容器内的下一个值 任何实现了__iter__和__next__...原创 2019-11-01 16:56:22 · 244 阅读 · 0 评论 -
python爬取百度文库DOC文档的简易脚本
页面分析 我们首先在百度文库随便搜索一片文章,(此脚本只针对DOC文档)打开它,查看源码 我们定位到具体某行文字,可以发现文字都分布在各个标签内部,这时候和我一样初学爬虫的小伙伴会想到用request来获取html源码,用BeautifulSoup进行操作,想法是好的,可是现在的百度文库不是以前,现在的百度文库的反爬手段还是有的,当你request下来后你会发现根本找不到文章中的文字,道高一尺魔...原创 2019-06-19 18:36:30 · 5888 阅读 · 1 评论
分享