6、二手车数据探索与分析

二手车数据探索与分析

1. 数据结构探索

在处理新数据集时,首先要了解其组织方式。若幸运的话,数据源会提供数据字典,用于描述数据集的特征。但对于二手车数据,没有相关文档,需要自行创建。

在 R 语言中, str() 函数可用于显示数据结构,如数据框、向量或列表的结构,也能为数据字典创建基本框架。以下是使用 str() 函数查看二手车数据结构的代码:

> str(usedcars)
'data.frame':   150 obs. of 6 variables:
 $ year        : int  2011 2011 2011 2011 ...
 $ model       : chr  "SEL" "SEL" "SEL" "SEL" ...
 $ price       : int  21992 20995 19995 17809 ...
 $ mileage     : int  7413 10926 7351 11613 ...
 $ color       : chr  "Yellow" "Gray" "Silver" "Gray" ...
 $ transmission: chr  "AUTO" "AUTO" "AUTO" "AUTO" ...

从输出可知,数据集包含 150 条观测记录(observations),通常用 n 表示观测数量,这里 n = 150 ,意味着有 150 辆二手车的数据。同时,数据有 6 个特征变量,分别为 y

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值