大数据的意义在于从海量的数据里寻找出一定的相关性,然后推演出行为方式的可能性。从这个角度来看,很多人所谈的大数据是相关数据的优化和整理概念,压根不是一回事
对大数据我不是专家,但由于大数据也是开放性的命题,所以我也就自己的认知水平,谈谈我对大数据的看法,更多集中在数据的金融应用上。
第一节 什么是大数据
一、大数据并非新事物
早在1980 年,著名未来学家阿尔文· 托夫勒就在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮”。不过,直到2009 年前后,“大数据”才成为互联网信息技术行业的流行词汇。2013 年,随着互联网金融的空前热门,也才真正意义上将“大数据”推到了高潮。
如果探究互联网金融与大数据流行之间的关联,背后有一个很关键的因素,就是互联网金融一直无法解答一个核心命题——风险控制。即互联网没有找到比传统金融更具优势的风控方法,从而使得互联网金融在兴起的过程中饱受质疑。
而横空出世的大数据成为了互联网金融支持者的一个重要精神支柱。大数据越不可测,就越具备想象力,对互联网金融而言,就越具解释力。
那么什么是大数据呢?我谈谈自己的看法。
大概四五年前,美国《商业周刊》资深作家约翰·伯恩一本畅销书《蓝血十杰》,对今天中国互联网金融和大数据理论爱好者们产生了极大的影响。这本书讲述了十个年轻人,出身名校哈佛,心怀理想,是天才中的天才。他们二战期间成为了美国空军的后勤英雄,卓有成效地将数字化管理模式应用于战争,为盟军节约了十亿美元的耗费,帮助盟军取得了胜利。
这说明数据的分析和管理,很早就被用于国家战争和商业运营了,为什么现在非要在数据前面加个“大”字呢?
上次在鸿儒论道,听社科院何帆教授的课程,他提到,从本质上讲一切的社会现象都是统计现象,并不像实验室里的试验那样有明确的因果关系。如经济学的供求定理就是一个统计规律。但是人类认知能力中最差的也是统计思维。
诺贝尔奖得主、心理学家卡尼曼曾经讲过,人类头脑中有两套思维。一套思维是本能的,比如我们的语言能力、模仿能力、第六感,等等,都是与生俱来的。如麻省理工学院的语言学家乔姆斯基指出,小孩子为什么到3 岁就能学会说话,而要到十几岁才能学会