《大数据时代》读后感(一)

本书探讨了大数据时代的核心思想,包括相关性胜于因果、全数据处理替代随机抽样、数据成为资产等。作者强调了大数据的核心在于预测,并提出了样本等于总体的新观念,主张全数据处理,抛弃传统采样的局限。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

  最近才开始看大数据时代这一经典的书,虽然书中一些事例已经耳熟能详,但是书中的思想依然那么新颖,那么经典。甚至在我查了这本书的出版日期是在2013年,英文原版甚至更早,距离今天已有六年之久,这六年大数据又有了许多重大的突破,但是这些都不影响我们学习这一经典著作。 

 

在绪论和引言中作者已经鲜明的表明了自己的观点:

1)大数据时代相关比因果更重要。

2)数据的收集能力使得我们的数据量爆炸性增长

3)大数据的核心是预测

4)全数据处理取代随机样本

作者在引言中超前的认为数据将成为一种资产。电脑存储和分析数据的方法取代电脑硬件成为了价值的源泉。虽然数据还没有被列入企业的资产负债表,但这只是一个时间问题。

 

第一章的核心思想是样本=总体抛弃采样

  作者认为采样,具有随机不足偏差严重不可发现新知识等弱点,是收到采集数据能力和处理数据能力不足的约束下的一种好方法。人们只能从采样数据中得出事先设计好的问题的结果——千万不要奢求采样的数据还能回答你突然意识到的问题。

但是全数据时代小公司也可以使用全部的数据,大也是一个相对的概念

公司项目规模
 谷歌频繁检索词条/疾控中心流感数据5000万
奥伦.爱奇奥尼Farecast飞机票价预测 
乔布斯23andme癌症病变药物失效自身所有DNA和肿瘤DNA排序
 xoom跨境汇款异常交易报警 
 相扑比赛比赛作弊 
 lytro相机记录所有光,重复聚焦1100万束
艾伯特-拉斯洛-巴拉巴西 关系网中有众多好友的人重要性不如一个与很多关系网外有联系的人 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值