写在前面:对象:所有数据 行为:模糊多样性而不是精确唯一性 追 求结果:相关性而非因果性
通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。
a) 建模是一件非常重要且了不起的事情。原本很小的事情,人力可以统计,但是一旦数据变成海量,就需要总结出规律以便后继的工作顺利展开。
b) 信息预测系统就是一个很好的例子。比如股票走势预估系统、天气预报系统。
c) 随机采样这种预测办法已经几乎被淘汰出局了,我们有足够多的数据可以使用。
大数据是人们获得新的认知、常遭新的价值的源泉;大数据还为改变市场、组织机构,以及政府与公民关系服务。
最惊人的是,社会需要放弃对因果关系的渴求,而仅需要关注相关关系。也就是说只需要知道是什么,而不需要知道为什么。这就推翻了自古以来的惯例,而我们做决定和理解现实的最基本方式也将受到挑战。
a)建立在相关关系之上的预测是大数据的核心。
技术成熟度曲线:炒作周期,指新技术、新概念在媒体上曝光度随时间的变化曲线。
大数据也一样,量变导致质变。
有时候,我们认为约束我们生活的那些限制,对于世间万物都有着相同的约束力。事实上,尽管规律相同,但是我们能够感受到的约束,很可能只对我们这样尺寸的事物起作用。对于人类而言,唯一一个最重要的物理定律就是万有引力。但对于细小的昆虫来说,物理宇宙中有效的约束是表面张力。
a) 所以换位思考有的时候可以开阔你的思维。阶层不一样,需要考虑的事情不一样。
当我们拥有海量即时数据时,绝对的精准不再是我们追求是主要目标。
a) 需要把握的是大方向。即是说,用俯瞰力,看到事情的发展方向。
b)“大数据”通常用概率说话。
c)“大数据”不需要也实现不了精确性。
d)数量规模变大的时候,确切的数字已经