多彩贵州城指在贵州文化旅游开设的一个对外交流的门户,展示贵州的风土人情、多样的自然生态景观和多彩的多民族原生态文化,而今天作为一个初级数据分析人员,使用Python技术来展示多彩贵州在2022年的在旅游数据的可视化和分析。欢迎大家来我们贵州玩耍!!!
分析所需的数据和一下材料,百度网盘打开即可:
链接:https://pan.baidu.com/s/1FIx3yKEg6CnQXNXLCrFEAw
提取码:GGZZ
使用工具:Jupyter Notebooks 推荐查看链接自主下载和学习:anaconda及jupyter安装配置
1.导入需要的包
!pip install --upgrade pyecharts
#升级 pyecharts 包,地图显示部分需要用到 pyecharts==1.9.0以上版本
import jieba#中文分词处理
import pandas as pd #数据处理库
from collections import Counter#数据统计库
from pyecharts.charts import Line,Pie,Scatter,Bar,Map,Grid#pyecharts数据可视化
from pyecharts.charts import WordCloud
from pyecharts import options as opts
from pyecharts.globals import ThemeType
from pyecharts.globals import SymbolType
from pyecharts.commons.utils import JsCode
如果安装jieba包发现安装不了可以参考这个链接:Anaconda-Python安装jieba库,我之前一直下不了jieba包就是用这个方法才可以的。
2.数据处理
2.1读取贵州景点的数据集
guizhou = pd.read_excel('F:\桌面\贵州景点.xlsx')
guizhou.head()
读取地址主要取决于你把excel文档放在那个位置了,这里我就放在了桌面上了。
2.2运用info()和shape查看贵州旅游景点数据集的索引和数据类型
guizhou.info()
guizhou.shape #查看数据集有几行几列
2.3查看贵州旅游景点数据集的数值型列汇总统计
guizhou.describe()
从describe可以得出结论有三种数字型数据,分别是评分价格销量。