一、Tableau简介、下载与安装
-
官网:https://www.tableau.com/
-
Harness the power of your data(利用数据的力量). Unleash the potential of your people.(释放你人民的潜力) Choose the analytics platform that disrupted the world of business intelligece.(选择打破商业智能世界的分析平台)
- For the individual analyst: your data journey awaits()
- For teams and organizations,Deploy at scale on the best-in-class analytics platform(在一流的分析平台上大规模部署)
- Embedded analytics: Your data. your product. powered by Tableau
-
Tableau相关数据在如下链接中:
链接:https://pan.baidu.com/s/11bXI85DOdMtQRngz1pkfcg 提取码:3mul 复制这段内容后打开百度网盘手机App,操作更方便哦
二、Tableau界面介绍
2.1、数据导入界面
- 如下是数据导入界面,主要分为本地文件、服务器文件
- 此处我们操作的是excel文件,导入酒店数据
1、强调的是拖、拽数据,工作表就是表中有几个sheet页,
2.2、数据源界面
1、可以点击符号进行隐藏字段操作,也可以取消隐藏,默认显示1000行,如果数据过多,可以直接设置你想要显示的行数(主要是节省CPU的资源)
2、abc表示为字符串类型、#表示为数字类型
2.3、工作表界面
1、先说数据栏:主要有维度(字符串类型)和度量(数值)两种类型
2、如下也是常用的工具栏:颜色:见名知意,给图中做设置,大小:对柱形图宽度,文本:对应的标签文字
3、列功能区对应的是X轴,行功能区对应的是Y轴
4、删除当前工作表、根据行功能区升降序
三、绘制条形图
3.1、各地区酒店数量
-
条形图主要是为了看不同区域谁多谁少来做比较,酒店数量是用记录数来体现的(每一条数据就是一家酒店)
-
如果行功能区显示不全的话,可以点击整个视图来显示完全;还可以进行行列切换显示,进行升降序选择;如果要在条形图上面显示数字的话,只要把记录数移动到标签上即可显示。
3.2、各地区酒店均价
- 价格拖动进去以后,点击度量,选上平均值
- 对于数值,它默认显示的是sum值,所以我们要点击度量进行修改,修改为平均值
3.3、价格等级堆积图
- 涉及到图的分类,属于构成形的,比如:油尖旺的酒店数量,油尖旺的数量构成关系;
1、构成如下:把价格等级拖拽到颜色中,记录数拖拽到标签中
四、Tableau绘制直方图
4.1、直方图概念与用途
直方图有很多种,主要用于呈现数据的分布情况,分为:标准型、锯齿型、偏峰型、陡壁型、双峰型(比如一家公司老板在南北方各开了一家工厂,南北方工厂的数据就出现了不同)、孤岛型
- 直方图是用来看分布的,条形图用来看大小的比较,直方图就是条形图的变种
4.2、创建评分直方图
- 创建直方图之前,需要先创建一个数据桶;比如我们研究评分直方图前,需要先点击度量下的(评分),右键评分–>创建–>数据桶;
- 如何调整数据桶的大小,把系统默认的0.341修改为0.25这个边界;
- 右键:编辑别名保存即可
五、本次课程作业
作业要求:
1、导入“豆瓣电影数据.xlsx”文件;
2、绘制各国家电影数量条形图(按此命名工作表),要求为横向条形图,按照升序排列,条形图顶部要有标签(要全部显示),选择整个视图将图表充满整个视图区,并给出分析结论;
3、创建电影评分的直方图(按此命名),数据间距为0.5分,修改底部数字标签,以实际评分区间为底部标签数值,标签要显示完整,并分析电影评分直方图。
-
各国家电影数量条形图,见图知义,大部分国家电影数量都是很少的在1000以下;
-
电影评分直方图