21、企业数据科学:机器学习与人工智能综合指南

企业数据科学:机器学习与人工智能综合指南

在过去4 - 5年里,数据科学解决方案发展迅速,就像NoSQL、Hadoop和其他数据挖掘解决方案等数据科学领域的发展一样。许多早期的数据库系统也融入了数据科学的关键特性,如机器学习等。本文将重点介绍主要用于机器学习和/或人工智能的解决方案,而非数据管理方面。

1. 数据科学工具与平台
1.1 R编程语言

R最初是为统计编程设计的环境,源于新西兰大学的一个项目,是John Chambers在贝尔实验室开发的S编程语言的变体。在过去7 - 8年里,R已经发展成为一种成熟、多面的语言,增强了对机器学习、高性能计算、可视化、计量经济学、时间序列分析等多个相关学科的支持。

商业版的R最初由Revolution Analytics提供企业支持,2015年更名为Microsoft R Open(开源版)和Microsoft R Server(商业版)。虽然以微软品牌销售,但Microsoft R也适用于Linux和Mac OS。

R中流行的机器学习包包括e1071、randomForest、gbm、kernlab、arules等,可在 https://cran.r-project.org/web/views/MachineLearning.html 查看。另一个流行的包caret,作为各种算法包的包装器,提供了一个统一的接口来运行算法,无需单独适应每个包的细微差别。

R还通过multicore、doMC等包支持多

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值