〇、概述
旅游大数据实验以网络上的评论数据为例,进行数据的抓取、存储、分析和展示,通过该案例的学习,能够了解一般数据分析的基本流程和采用的基本分析技术,为将大数据技术应用到其他行业奠定基础。
一、爬取数据
我们将众誉旅游大数据网站上爬取其中一个景区的部分评论数据。爬取的众誉大数据页面的网址是http://zydsj.net/zydsj.html。界面如下:

1、打开Pycharm
双击桌面Pycharm图标,启动Pycharm。
2、打开项目spider
在Pycharm导航栏中选择File->Open,选择文件夹/home/user/PycharmProjects/spider,点击OK打开项目。

爬虫代码主要使用requests包和etree对指定网页的指定的数据进行爬取。

3、执行程序
在项目文件中右键,选择Run执行程序程序会爬取评论数据并存储在文件中,文件路径为/home/user/CommentFile/co

最低0.47元/天 解锁文章
3893

被折叠的 条评论
为什么被折叠?



