
Python爬虫笔记
MUYUN友逹
努力做个坏小孩
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python爬虫笔记 | HTML基础
使用python版本:3.7.0 64-bit如果把HTML的学习依序分为三个层次的话,应该是读懂、修改、编写。读懂: 只有读懂了HTML,我们才能看得懂网页结构,才有可能运用Python的其他模块去解析数据和提取数据。所以想写爬虫程序的话,一定要先学好HTML基础。修改: 在读懂HTML文档的基础上,学会修改HTML代码,是可以做些有趣的事情的。编写: 如果达到了这个水平,那就可以去...原创 2019-10-24 21:23:20 · 477 阅读 · 0 评论 -
Python爬虫笔记 | 初识爬虫技术
使用python版本:3.7.0 64-bit爬虫,从本质上来说,就是利用程序在网上拿到对我们有价值的数据。爬虫的工作原理四步骤第1步: 获取数据。 爬虫程序会根据我们提供的网址,向服务器发起请求,然后返回数据。第2步: 解析数据。 爬虫程序会把服务器返回的数据解析成我们能读懂的格式。第3步: 提取数据。 爬虫程序再从中提取出我们需要的数据。第4步: 储存数据。 爬虫程序把这些有用...原创 2019-10-21 23:12:00 · 657 阅读 · 1 评论 -
Python爬虫笔记 | 使用pip安装requests模块及其后续问题
使用python版本:3.7.0 64-bit关于requests模块网页爬虫必备模块之一,用于下载网页源代码、文本、图片甚至是音频等。首先安装pip首先下载安装pip:https://pypi.org/project/pip/#downloads点击 “Download files” ,选择红框中的文件,下载安装。使用pip安装requests模块快捷键“ win + r ”...原创 2019-10-21 22:17:50 · 1220 阅读 · 0 评论