文章目录
客户特征分析 - Tableau
1. 说明
数分基础(03-1)客户特征分析,是用Python作为分析工具
对于非技术用户来说,Tableau 直观易上手,可以快速创建图表、即时交互,这里用 Tableau Desktop
这里主要是演示一下如何用Tableau来做分析这件事情的主要过程
关于Tableau的详细操作以及为什么等等,暂时不做解释,需要的可以自行查阅资料

同时特别提醒
涉及操作,篇幅会长,但有时候很长的一段,操作很简单
非技术同学不要心理上预先觉得麻烦
其实很快的,特别是慢慢熟练了,会发现用可视化工具可以迅速获得对数据集的认识,还是很方便的
千万不要觉得烦,就放弃这个快速工具
2. 思路与步骤
数据准备
初始视图
关键指标
分析可视
3. 数据准备和导入
可以在EXCEL中进行初步检查和处理,例如缺失值、字段类型、异常值、冗余数据等,然后再导入Tableau。
涉及操作,篇幅会长,但有时候很长的一段,操作很简单
非技术同学不要心理上预先觉得麻烦
其实很快的
3.1 用EXCEL初步检查和处理数据
3.1.1 打开
双击EXCEL文件
数据集Global_Superstore同前不变,可在此直接下载 数分基础(01)示例数据集

在查看中等规模数据时候,EXCEL几个快捷键很好用,见(04)。
在数据表任意点选单元格,ctrl + end,移动到工作表中最后一个有数据的单元格,显示“X51291”
数据集包含了51290条记录和24个字段,这和Python首先加载数据集,看看大体数量,字段数目情况一样的。

3.1.2 初步检查
(1)缺失值
检查
ctrl + home 回数据区左上角
ctrl + 方向键右→ ,快速移动到数据第一行最右列
方法一,辅助列
添加一个新列,用于统计每行的缺失值数量
在新列的第一个单元格中输入公式 =COUNTBLANK(A2:X2)
鼠标移动到写公式的单元格右下角,单元格右下角出现实心小方块,光标变成实心十字架时候,双击实心小方块,将公式应用到所有行

同时在最后一行 也看下每列的缺失值情况

这样可以发现 缺失值集中在邮编这一列
方法二,逐列筛选
除了添加辅助列,也可以 Ctrl + shift + L,筛选模式,逐列点击列顶部的筛选箭头,下拉菜单,显示该列中所有可能的值,在下拉菜单的底部,如果有“(空白)”

最低0.47元/天 解锁文章
5968

被折叠的 条评论
为什么被折叠?



