钻石数据集的数据探索与分布可视化
1. 钻石数据集介绍
为了展示处理大型数据集的工具,我们将使用内置的钻石数据集。该数据集包含约 54,000 颗钻石的价格和质量信息。以下是数据集的部分内容展示:
diamonds
#> Source: local data frame [53,940 x 10]
#>
#>
carat
cut
color clarity depth table price
x
y
#>
(dbl)
(fctr) (fctr)
(fctr) (dbl) (dbl) (int) (dbl) (dbl)
#> 1
0.23
Ideal
E
SI2
61.5
55
326
3.95
3.98
#> 2
0.21
Premium
E
SI1
59.8
61
326
3.89
3.84
#> 3
0.23
Good
E
VS1
56.9
65
327
4.05
4.07
#> 4
0.29
Premium
I
VS2
62.4
58
334
4.20
4.23
#> 5
0.31
Good
J
SI2
63.3
58
335
4.34
4.35
#> 6
0.24 Very Good
J
VVS2
62.8
57
336
3.94
3.96
#> ..
...
...
...
...
...
...
...
...
...
#>
z
#>
(dbl)
#> 1
2.43
#> 2
2.31
#> 3
2.31
#> 4
2.63
#> 5
2.75
#> 6
2.48
#> ..
...
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



