本文为 「茶桁的 AI 秘籍 - BI 篇 第 10 篇」

Hi,你好。我是茶桁。
上一节课,咱们了解了图形的具体绘制方法,接下来咱们还要看看除了图形绘制之外,还有哪些要做的可视化分析。还有一些是跟模型相关的可视化,在运算过程中我们可能会有一些模型。
来,我们先上一个例子来体验一下,包括它中间的一些数据可视化。这是一个泰坦尼克海难的一个数据示例,我们都知道这是一个著名的十大灾难之一,究竟有多少人遇难,各方统计的结果不一致。现在我们可以得到部分的数据, 数据我还是一样放在文末了。
这个数据格式是 csv 的,一共有两个文件:
- train.csv 训练集,包含特征信息,分类结果(存活与否)
- test.csv 测试集,只包含特征信息
泰坦尼克号这个练习相信以前有人做过,这是机器学习里面入门的一道经典问题。就是泰坦尼克号的乘客生存预测问题。
train 有 891 个人, 咱们来简单的看一下,这些人有一些特征。
| 字段 | 描述 |
|---|---|
| Passengerld | 乘客编号 |
| Survived | 是否幸存 |
| Pclass | 船票等级(有些特征标注的英文) |
| Name | 乘客姓名 |
| Sex | 乘客 |

订阅专栏 解锁全文
3598

被折叠的 条评论
为什么被折叠?



