1.内容简介
本书是从理论到实践的全面且细致的企业数据驱动指南,完整还原作者在百度大数据工作从零到一构建百度用户行为大数据处理平台的经历。详解大数据本质、理念与现状,围绕数据驱动四环节—采集、建模、分析、指标,深入浅出地讲述企业如何将数据驱动方案落地,并指出数据驱动的价值在于“数据驱动决策”、“数据驱动产品智能”。最后通过互联网金额、电子商务、企业服务、零售四大行业实践,从需求梳理、事件指标设计、数据接入阶段、实际应用四大阶段介绍数据驱动在不同领域的商业价值,全面展示大数据在各个领域内的应用情况与趋势展望。
2.大数据思维与数据驱动
1)大数据的本质:大数据思维指的是企业在数据化运营和管理过程中运用思维和方式。
2)数据驱动理念和现状
(1)数据驱动的价值
- 驱动决策
- 驱动产品智能
(2)企业内部数据驱动现状
- 初创企业无法拿到更多的数据,需要凭直觉来决策“做一款什么样的产品”。
- 当一家企业的产品开始被市场接纳,而实际工作中,企业在实现数据驱动的道路上,依旧困难重重。
3)大数据时代到来的条件
(1)数据采集能力增强
(2)数据处理能力增强
(3)数据意识的提升
3.数据驱动的环节
1)可以分成4个环节:数据采集、数据建模、数据分析和数据指标。
2)数据采集与埋点
(1)数据采集现状
-
困惑:如何采、采哪些、用什么手段
-
由于数据采集不完整,无法实现深度分析。
-
统计不准。
-
云模式的数据分析平台让不少企业有安全顾虑,不愿意将核心数据放到第三方平台上。
-
痛苦:埋点混乱,常现埋错、漏埋
-
无奈:数据团队和业务工程团队配合困难
(2)数据采集遵循法则 -
大:强调的是宏观的大。不只需要海量数据,还要从系统的角度考虑。
-
全:强调多种数据源。
-
细:要求把不同维度都采集下来。
-
时:强调时效性。
(3)科学的数据采集和埋点方式
- 可视化/全埋点(无埋点):只要在页面上嵌入SDK,就可以采集页面上所有的点击行为,优势是:
- 可视化展示宏观指标,满足基本数据分析需求。
- 技术门槛低,使用与部署较简单。
- 用户友好性强。
- 无埋点(全埋点)