进军指南
如果是没有任何语言开发经验的同学, 建议从头系统的学起, 无论 是书、视频还是文字教程都可以。
如果是有其他语言开发经验的同学 ,建议从一个案例入手 , 比如爬取某个网站的套图 。因为语言都是想通的 ,语法之类的只要你要语感
,代码基本能读个八九不离十所以不建议有经验的开发者从头学起 ,无论是视频还是书 ,对于开始学一门语言来说都是太浪费时间了
。当然,等你深入进去以后还是要系统的去学习 ,这是后话 。
软件工具
Python3
这里选择的是最新版 Python 3.7.1
安装教程这里推荐:http://www.runoob.com/python3/python3-install.html
win下载地址:https://www.python.org/downloads/windows
Linux下载地址:https://www.python.org/downloads/source
PyCharm
可视化开发工具:http://www.jetbrains.com/pycharm
这里说一句题外话,如果你在10-20分钟还没有把运行环境,集成开发环境配置并搭建好,我建议你还是放弃开发吧,祖国可能有更合适的岗位给你留着。
案例
实现步骤
以妹子图为例,其实很简单,分以下四步:
- 获取首页的页码数,并创建与页码对应的文件夹
- 获取页面的栏目地址
- 进入栏目,获取栏目页码数(每个栏目下有多张图片,分页显示)
- 获取到栏目下对用标签容器中的图片并下载
注意事项</

本文为Python爬虫初学者提供指导,建议无经验者从基础学起,有经验者直接通过案例实践。推荐使用Python3和PyCharm,以爬取妹子图为例,详细介绍了获取网页数据的步骤,包括获取页码、栏目、图片等,并提到了爬虫开发中的注意事项,如导库、定义函数、处理防盗链和异常捕获。
最低0.47元/天 解锁文章
2442

被折叠的 条评论
为什么被折叠?



