大数据与数据科学的全面剖析
1. 企业级数据科学基础部署
企业级数据科学基础设施的部署,涵盖软件和硬件层面。在管理方面,围绕此类举措存在一些常见关键问题。同时,大型组织在数据挖掘和机器学习中使用的关键企业解决方案也值得关注。
以在亚马逊网络服务(AWS,一个基于云的系统)上启动 RStudio 服务器为例,AWS 如今已成为全球领先的云服务提供商。该操作展示了在短短几秒钟内启动整个机器是多么简单。不过,需要谨慎且明智地使用 AWS,以避免产生高额费用,其优缺点都需考量。
2. 企业大数据与数据科学战略
如今,大数据和数据科学无处不在,从硅谷的成功案例可见一斑。像优步(Uber)这样的打车应用,估值接近 700 亿美元,成为全球最受欢迎的公司之一;爱彼迎(Airbnb)将公寓共享业务发展得如火如荼,估值达 300 亿美元。这些事件使大数据和数据科学从纯粹的理论和技术主题,转变为与无限投资成功相关的常用术语。
几乎所有大型科技供应商都开始添加被归类为大数据的功能,如今大多数投资科技的公司都在有意或无意地使用大数据的某些方面。然而,实施过程的定义较为模糊,除了 Hadoop 可能是大多数公司采用的事实上的框架外,没有明确的框架能保证成功。
企业大数据和数据科学战略的实施大致分为三个阶段:
- 休眠阶段 :公司尚未确立明确的指令,但有关于大数据的讨论。
- 被动阶段 :讨论开始形成更正式的形式,通常会委派团队评估对组织的影响和价值。
- 主动阶段 :公司开始评估技术并积极实施。 </
大数据与数据科学解析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



