大数据
1、什么是大数据
简单说就是身边的一切,你看到的是,听到的是,闻到的感觉到的触摸到的都是
2、具体一点
天猫淘宝的购物数据,你的聊天记录,医疗记录,看书或者挑东西时候的推荐物品
大数据的问题
1、生活中的种种数据数量如此之多,如何存储
2、要让数据有意义,又该怎么去处理海量的数据
Google对大数据问题的思想
1、GFS:Google File System
对数据进行分布式文件系统的存储,解决的大数据的存储问题
2、MapReduce
最初是因为Google要去爬取全球的网页然后对其进行排名(PageRank)而衍生出的问题,一种用于大数据计算的模型,核心思想是大事化小处理,最后在合并结果,先拆分再合并
3、BigTable
采用NoSQL数据库将数据存在一张大表之中,通过牺牲存储的空间来换取性能
实现思想 -> Hadoop
主要结构
&n

本文探讨了大数据的问题,包括存储和处理挑战。Google通过GFS解决了存储问题,MapReduce提供了大数据计算模型,而BigTable利用NoSQL数据库存储数据。这些思想被Hadoop所采纳,Hadoop的HDFS、YARN和HBase分别对应GFS、MapReduce和BigTable的概念。
最低0.47元/天 解锁文章
6558

被折叠的 条评论
为什么被折叠?



