1. 大数据与小数据
大数据
美国知名研究机构 Gartner 对于“大数据”(Big Data)给出了这样的定义 :大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据通常用来形容一个企业创造的大量非结构化数据和半结构化数据。
大数据的特征经常被称为 4 个“V”——Volume(数据体量大)、Variety(数据类型繁多)、Velocity(处理速度快)、Value(价值密度高)。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的种种传感器,都是数据来源或者承载的方式。
大数据分析常与云计算联系到一起,因为实时的大型数据分析需要数十、数百甚至数千的计算机并行工作。大数据还需要特殊的技术,以便有效处理大量的有时效性的数据。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。即在于提高对数据的加工能力,通过“加工”实现数据的“增值”。
从技术看,大数据与云计算就像硬币的正反面。大数据必然采用分布式云架构,其特点在于对海量数据进行分布式数据挖掘,依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术、数据挖掘电网、可扩展存储系统等。大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用。工程和科学问题可借用的手段不够且尚未被重视。大数据工程是指大数据的规划、建设、运营、管理的系统工程;大数据科学则关注大数据网络发展和运营,发现和验证大数据的规律及其与自然界和社会活动之间的关系。
小数据
第一个意识到“小数据”(Small Data)重要性的是美国康奈尔大学的教授德波哈尔·艾斯汀。艾斯汀的父亲去世之前几个月,这位计算机科学教授就注意到老人的“数字社会脉动”出现了细微的不同——他不再发送电子邮件,不去超市买菜,到附近散步的距离

最低0.47元/天 解锁文章
2363

被折叠的 条评论
为什么被折叠?



