R 入门:数据准备、导入与检查全攻略
在使用 R 进行数据分析和可视化时,数据的准备、导入和检查是至关重要的基础步骤。下面将详细介绍如何完成这些步骤,以及遇到问题时的解决方法。
数据准备
在使用 R 进行数据分析时,有一个关键原则需要牢记:一旦建立了“原始数据”的副本,使用 R 进行数据可视化和分析时,除非收集了更多数据,否则永远不需要更改原始文件。因此,一定要妥善保存原始数据文件。
如果数据不是 R 喜欢的格式,或者数据来自他人,又或者是由机器记录的,该怎么办呢?一种方法是将数据退回并说明所需的格式,但这种请求可能不太容易被接受,此时就需要自己动手处理。可以在 Excel 中重新排列数据,但这可能会导致错误,而且对于大型数据集来说,既耗时又乏味。另一种选择是让 R 来完成这项艰巨的任务,具体操作方法可参考相关附录。
数据导入
要将数据导入 R,首先需要获取所需的数据集,可从 http://www.r4all.org/the-book/datasets 下载。下载后,不要忘记解压并将其放在一个安全的地方。以下是具体的操作步骤:
1. 创建文件夹 :在存储研究信息的主文件夹中创建一个新文件夹,例如在“我的文档”(旧 PC)或“文档”(新 PC 和 Mac)中的“Projects”文件夹内创建一个名为“MyFirstAnalysis”的文件夹。
2. 细分文件夹 :在“MyFirstAnalysis”文件夹内再创建两个文件夹,分别为“Analyses”和“Datasets”。将下载的数据集移动到“Datasets”文件夹中。如果是进行完整的项目,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



