拓扑与几何助力的数据科学:从机器学习到几何结构洞察
1. 数据科学工具与学习资源
在数据科学领域,R 语言是一个强大的工具。可以使用 browseVignettes(package="mboost") 命令查看特定 R 包的使用说明。R 语言拥有广泛的用户群体,当遇到特定问题时,可以通过互联网搜索或编码论坛获取额外的资源。对于编程不太熟悉的人,建议先进行免费的 R 语言编程教程学习,或者在 R 中处理一些数据,再尝试相关代码。
由于 R 语言不断发展,新包会不断添加,旧包可能会被移除。建议通过包的官方网站和网络搜索来跟进这些发展。对于已停止维护的包,仍可作为旧版包安装和使用,但需要谨慎,因为包作者不会再对其进行更新。
同时,对于 Python 用户,虽然很多示例是用 R 代码呈现的,但可从 这里 下载 Python 包和函数的翻译版本。不过,部分翻译可能不存在,或者某些包在特定操作系统上无法正确安装。鼓励开发者在没有合适 Python 应用时进行开发,未来可能会有更多对本书方法(以及未来开发的方法)的 Python 支持。
2. 机器学习分类
机器学习算法种类繁多,可大致分为以下几类:
- 监督学习 :旨在预测某个变量,如医院新协议下的治疗结果或客户未来六个月内离开的概率。预测的变量称为因变量或目标,用于预测的变量称为自变量或预测因子。预测数值变量时称为回归,预测分类变量时称为分类。常见
超级会员免费看
订阅专栏 解锁全文
1374

被折叠的 条评论
为什么被折叠?



