专业机器学习主题探索
1. JSON 处理包
在 R 语言中,近期出现了两个新的 JSON 处理包。
- RJSONIO :由 Duncan Temple Lang 开发,最初旨在成为 rjson 包的更快、更具扩展性的版本,不过现在它们实际上已基本相同。
- jsonlite :由 Jeroen Ooms 开发,因其创建的数据结构更符合 R 语言习惯,尤其是在使用来自 Web API 的数据时,迅速受到关注。
这三个包(包括 rjson)在实践中几乎相同,都实现了 fromJSON() 和 toJSON() 函数,具体使用哪个包可根据个人偏好决定。
2. 特定领域数据处理
机器学习已广泛应用于各个学科,但一些领域非常专业,需要特定知识才能充分发挥其潜力。以下介绍两个广泛使用机器学习技术的领域。
2.1 生物信息学数据分析
生物信息学领域主要关注计算机和数据分析在生物学领域的应用,特别是对基因组的理解。该领域的数据具有独特性,带来了一些挑战:
- 基因数据特点:生物拥有大量基因,且基因测序相对昂贵,导致典型数据集的特征(基因)数量多于样本(已测序生物)数量,使得传统的可视化、统计测试和机器学习方法难以应用。
- 数据加载难题:专有微阵列“芯片实验室”技术的使用增加,加载基因数据需要高度专业的知识。
不过,有相关资源可帮助解决这些问题:
- CRAN 任务视图 :列出了 R
超级会员免费看
订阅专栏 解锁全文
1686

被折叠的 条评论
为什么被折叠?



