机器学习成功之道:R 笔记本、R Markdown 与高级数据探索
1. 项目回顾与 R 笔记本的引入
在完成一个大型机器学习项目后,我们常常会松一口气,然后回顾整个过程,疑惑时间都去哪儿了。我们可能会反复思考是否本可以避免一些明显的错误,或者做出不同的设计选择。这是因为项目完成时,我们往往会忘记那些耗费时间的死胡同和错误的开始,将整个过程简化为一条从起点到终点的直线,而忽略了实际的曲折路径。
在数据科学职业生涯早期,人们往往认为有办法避免这些弯路,直接得出结论。但实际上,这些探索工作并非徒劳,而是机器学习过程中不可或缺的一部分。随着我们对数据的理解加深,机器也会变得更智能。
然而,到了职业生涯后期,我们可能会觉得这些探索工作的影响力不够持久,同样的错误经常重复出现。这部分原因是我们更容易记住成功的经验,而失败的经验往往被遗忘,甚至从 R 代码文件中删除。因此,我们需要一种方法来呈现完整的调查过程,包括死胡同和错误。
RStudio 开发环境提供了 R 笔记本这一解决方案。R 笔记本是一种特殊的 R 代码文件,它将 R 代码和解释性自由文本结合在一起。这些笔记本可以轻松编译成 HTML、PDF、Microsoft Word 格式,甚至可以制作成幻灯片和书籍。生成的输出文档可以将代码嵌入报告文本中,或者将文本嵌入代码中。
2. R 笔记本的使用
R 笔记本本质上是纯文本文件,类似于标准的 R 代码文件,但文件扩展名为 .Rmd。在 RStudio 中,可以通过以下步骤创建新的 R 笔记本:
1. 打开 File 菜单。
2. 选择 New File。
3. 选择 R Notebook 选项
超级会员免费看
订阅专栏 解锁全文
120

被折叠的 条评论
为什么被折叠?



