企业数据科学:机器学习与人工智能综合指南
在过去4 - 5年里,数据科学解决方案发展迅速,就像NoSQL、Hadoop和其他数据挖掘解决方案等数据科学领域的发展一样。许多早期的数据库系统也融入了数据科学的关键特性,如机器学习等。本文将重点介绍主要用于机器学习和/或人工智能的解决方案,而非数据管理方面。
1. 数据科学工具与平台
1.1 R编程语言
R最初是为统计编程设计的环境,源于新西兰大学的一个项目,是John Chambers在贝尔实验室开发的S编程语言的变体。在过去7 - 8年里,R已经发展成为一种成熟、多面的语言,增强了对机器学习、高性能计算、可视化、计量经济学、时间序列分析等多个相关学科的支持。
商业版的R最初由Revolution Analytics提供企业支持,2015年更名为Microsoft R Open(开源版)和Microsoft R Server(商业版)。虽然以微软品牌销售,但Microsoft R也适用于Linux和Mac OS。
R中流行的机器学习包包括e1071、randomForest、gbm、kernlab、arules等,可在 https://cran.r-project.org/web/views/MachineLearning.html 查看。另一个流行的包caret,作为各种算法包的包装器,提供了一个统一的接口来运行算法,无需单独适应每个包的细微差别。
R还通过multicore、doMC等包支持多
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



