大数据挖掘:从概念到实践
1. 机器学习与大数据的兴起
科技的进步是推动机器学习在数据分析领域发展的关键因素,如今机器学习已成为行业内常用的术语。像自动驾驶汽车、能根据交通模式调整的地图交通数据,以及Siri和Cortana等数字助理,都是机器学习在实体产品中商业化的实例。
大数据无疑是一个广泛的主题,乍一看可能过于复杂。但熟能生巧,学习大数据也是如此,你参与得越多,对相关主题和术语就越熟悉,对这个主题也会越得心应手。深入研究大数据分析的各个维度,有助于你培养对这一主题的直觉。
2. 大数据挖掘的定义
大数据挖掘是大数据分析的两大主要类别之一,另一个类别是预测分析。简单来说,大数据挖掘指的是处理大规模数据集的整个生命周期,从数据采购到使用相应工具进行分析和实施。
3. 企业中的大数据挖掘
在大中型企业中实施大数据解决方案是一项具有挑战性的任务,因为需要考虑的因素极其动态和多样,其中最重要的是确定该解决方案要解决的具体业务目标。
3.1 制定大数据战略的步骤
- 确定需求方 :确定哪些业务部门将从大数据挖掘解决方案中获益最大是第一步。通常这些部门已经在处理大量数据集,对业务至关重要,且对收入有直接影响。例如,制药企业中的商业研究、流行病学、健康经济学和成果部门;金融服务企业中的算法交易部门、定量研究部门甚至后台部门。
- 确定用例 :前一步确定的部门可能已经有一个能满足其需求的平台。在多个用例和部门之间进行优先级排序,需要对各业务部门的工作有深入了解。确定有影响力的分
超级会员免费看
订阅专栏 解锁全文
3905

被折叠的 条评论
为什么被折叠?



