时至今日,大数据已无处不在,所有行业都在经受大数据的洗礼。但同时我们也发现,不同于传统关系型数据库的表模型,现实世界是非常丰富、高维且相互关联的。此外,我们一旦理解了大数据的演进历程以及对数据库进阶的强需求,就会真正理解为什么“图”无处不在,以及为什么它会具有可持续的竞争优势,并最终成为新一代主流数据库标准。
大数据的发展方兴未艾。我们通常把大数据元年定为2012年,但是大数据相关技术的出现远早于2012年。例如Apache Hadoop是由Yahoo!在2006年发布并捐赠给Apache基金会的,而Hadoop这个项目肇始则是受到了谷歌2003年的GFS(Google File System,谷歌文件系统)与2004年的MapReduce两篇论文的启发。如果我们再往前追溯,那么GFS与MapReduce之所以能出现是因为谷歌的互联网搜索引擎业务的发展,而其搜索引擎最核心的技术大概要属PageRank算法了。以谷歌联合创始人Larry Page名字命名(且与Web Page一语双关)的PageRank算法是一种典型的图算法。很显然,我们回到了终点,它同时还是起点——大数据技术的发展竟然源自一种图计算技术,而它的发展趋势也伴随着图计算技术的全面发展——从大数据到快数据,最终到深数据(图数据)。
从宏观来看,大数据的发展史基本上就是数据科技(Data Technologyÿ