数据可视化与商业决策:案例解析
1. 模型性能分析
1.1 问题分析
在银行工作中,面对员工分享的模型性能图(图 7.3a),需先提出一系列问题来深入了解数据。具体问题如下:
- 图中使用的缩写词是什么意思,坐标轴代表什么?
- 图右侧的次 y 轴对应的是哪些数据?
- 线条样式的选择有什么原因?
- 大红色框想要突出显示什么?
1.2 反馈建议
1.2.1 使用易懂的语言
原图表的语言可能是统计编程软件的输出,对于非统计专业人员来说难以理解。应将缩写和专业术语转换为易懂的表述,例如将 “vol_prepay_rt” 转换为 “自愿提前还款率”,即提前还清贷款的人数比例。同时,要明确解释缩写词,如 “ltv_bin” 代表贷款价值比(LTV),“UPB” 是未偿还本金余额。对于图表标题和底部的复杂语言,要根据受众决定是否突出显示,若面向高级领导团队,可能无需详细说明技术细节。
1.2.2 谨慎改变线条样式
虚线很吸引注意力,但会增加视觉噪音。建议仅在表示不确定性(如预测、目标等)时使用虚线,如实线用于表示实际数据,虚线用于表示估计数据。图 7.3a 中蓝色模型线使用虚线是合适的,但绿色 UPB 线使用虚线不太恰当,因为未偿还本金余额应该是已知的实际数据。
1.2.3 消除次 y 轴
次 y 轴会增加读者解读数据的难度,建议避免使用。可以隐藏次 y 轴,直接标注对应的数据;或者创建两个使用相同 x 轴的图表。图 7.3a 中未偿还本金余额用 “千的千倍” 表示较奇怪,可将单位改为百万,使图表更易处理和讨论
数据可视化助力商业决策
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



