大数据:定义、变革与主流化
1. 大数据的定义
在互联网上搜索,你会找到数十种关于大数据的定义。常见的有“3V”定义,即数据的体量(Volume)、种类(Variety)和速度(Velocity)。还有一些更具技术性的定义,例如来自奥莱利媒体分析师埃迪·邓比尔(Edd Dumbill)的定义:“大数据是指超出传统数据库系统处理能力的数据。这些数据规模太大、移动速度太快,或者不符合你的数据库架构的限制。要从这些数据中获取价值,你必须选择一种替代方法来处理它。”
然而,这些定义虽然准确,但却忽略了大数据的真正价值。大数据应该通过其影响的大小来衡量,而不是通过它所消耗的存储空间或处理能力。很多时候,关于大数据的讨论往往陷入了太字节(TB)和拍字节(PB)的规模,以及如何存储和处理数据,而不是如何使用数据。
作为消费者和企业用户,我们关心的不是数据的大小和规模,而是能够提出并回答对我们重要的问题。例如:
- 为了治疗严重的健康状况,我们应该服用什么药物?
- 我们应该给学生提供哪些信息、学习工具和练习,以帮助他们更有效地学习?
- 我们应该在营销活动上多投入多少资金?
- 我们的客户正在使用新产品的哪些功能?
这才是大数据真正的意义所在。它是一种能够以比以往更低的成本捕获和分析数据,并从这些数据中获得可操作的见解的能力。
1.1 大数据的变革性
大数据真正具有变革性的地方在于我们现在使用数据的便捷性。我们不再需要花费数月或数年时间来设置和使用复杂的软件。几乎我们所需的所有分析能力都可以通过简单的软件下载或云计算获得。
我们也不再需要昂贵的设备来收集数据。现在,我们可
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



