背景引入:
鉴于大数据的性质及其分析能力,在项目开始时需要考虑和计划许多问题,因此要求组织识别并建立一套独特的治理流程和决策框架,以确保责任方了解大数据的性质,影响和管理要求。第三章通过详细讲解大数据分析时的主要的潜在问题和注意事项。
3.1-3.5数据分析之前要考虑的问题(同学讲的是数据前期处理)
3.6-3.10 数据分析过程中可能遇到的问题(硬件和技术支持)
3.11 具体阐述分析过程(大数据分析的生命周期)
3.1 组织的先决条件:
大数据管理框架、能进行良好数据管理的高质量数据。
3.2 数据获得(不应该为获取)
Data Procurement为数据采购的意思,由于某些数据由公司的设备或者其他平台免费获得,无需购买,所以我把这部分称为获得。(数据获取指利用一种装置,将来自各种数据源的数据自动收集到一个装置中,书中数据获得方式更丰富)
互联网或者企业获取:直接从一些专业类服务网站上抓取或者购买(例如大众点评、携程),或直接从大家在其公开的地图服务上的标注中进行筛选和获取。这就是google、百度、高德自己免费向社会开放其地图服务所能够获得的利益。尤其对于开放API免费企业客户的使用,这种获取是很有价值的。
3.3 隐私性
无隐私不数据,无数据就无服务。享受大数据时代便利的同时我们也在产生大量数据,通过平时浏览的网页、购买的商品、出行的记录等等行为都透露着自身的信息,分析这些数据可以揭示一些隐私信息。(通过大数据算法勾勒出用户肖像,然后把他们想要的、喜欢的精准送达,进而带动商业价值实现几何数级的增长。亚马逊的个性化推荐助其销售量翻番,而Facebook的精准广告投放更是成功将大把的粉丝和流量变现,这些商业佳话也是我们隐私泄露的证明。)