6、二手车数据探索与分析

kotlin6android

于 2025-10-12 12:28:54 发布

阅读量12

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习与R实战精要文章标签：二手车数据探索 R语言

本文链接：https://blog.youkuaiyun.com/kotlin6android/article/details/154665938

机器学习与R实战精要专栏收录该内容

36 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

二手车数据探索与分析

1. 数据结构探索

在处理新数据集时，首先要了解其组织方式。若幸运的话，数据源会提供数据字典，用于描述数据集的特征。但对于二手车数据，没有相关文档，需要自行创建。

在 R 语言中， str() 函数可用于显示数据结构，如数据框、向量或列表的结构，也能为数据字典创建基本框架。以下是使用 str() 函数查看二手车数据结构的代码：

> str(usedcars)
'data.frame':   150 obs. of 6 variables:
 $ year        : int  2011 2011 2011 2011 ...
 $ model       : chr  "SEL" "SEL" "SEL" "SEL" ...
 $ price       : int  21992 20995 19995 17809 ...
 $ mileage     : int  7413 10926 7351 11613 ...
 $ color       : chr  "Yellow" "Gray" "Silver" "Gray" ...
 $ transmission: chr  "AUTO" "AUTO" "AUTO" "AUTO" ...

从输出可知，数据集包含 150 条观测记录（observations），通常用 n 表示观测数量，这里 n = 150 ，意味着有 150 辆二手车的数据。同时，数据有 6 个特征变量，分别为 y