初学Python,学到Python爬虫时在网上找资料,发现找到的大部分都是前部分内容对运作方式介绍,然后就直接上代码了,这样对像我一样的小白来说比较困难,代码的注释较少,部分代码块没有详细说明运作方式和具体作用,所以写此笔记方便别人和自己以后进行学习查看。
--操作系统window--Python2.7.10
爬取网站编码:utf-8 ,如果运行显示的汉字不正确更改你本地的编码类型为utf-8进行解码即可显示正常的汉字
dome使用的是from bs4 import BeautifulSoup这个模块需要安装,下载地址在最后,windows在cmd下直接使用命令安装这个模块,或手动下载安装:
windows安装命令:
pip install

这篇博客是针对Python初学者的爬虫教程,作者在Windows环境下使用Python2.7.10进行教学。主要内容包括如何安装BeautifulSoup模块,解决编码问题,以及使用BeautifulSoup进行简单的网页内容抓取,特别是天气预报信息。教程中提到,通过了解BeautifulSoup的基础用法,可以为进一步的网页爬取和内容下载打下基础。
最低0.47元/天 解锁文章
1308

被折叠的 条评论
为什么被折叠?



