6:旅游大数据综合实验

〇、概述

旅游大数据实验以网络上的评论数据为例,进行数据的抓取、存储、分析和展示,通过该案例的学习,能够了解一般数据分析的基本流程和采用的基本分析技术,为将大数据技术应用到其他行业奠定基础。

一、爬取数据

我们将众誉旅游大数据网站上爬取其中一个景区的部分评论数据。爬取的众誉大数据页面的网址是http://zydsj.net/zydsj.html。界面如下:

1、打开Pycharm

双击桌面Pycharm图标,启动Pycharm。

2、打开项目spider

在Pycharm导航栏中选择File->Open,选择文件夹/home/user/PycharmProjects/spider,点击OK打开项目。

爬虫代码主要使用requests包和etree对指定网页的指定的数据进行爬取。

3、执行程序

在项目文件中右键,选择Run执行程序程序会爬取评论数据并存储在文件中,文件路径为/home/user/CommentFile/co

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值