何为大数据?

最新推荐文章于 2024-12-06 14:50:40 发布
七O518 最新推荐文章于 2024-12-06 14:50:40 发布
阅读量842 收藏
点赞数 1
文章标签: 大数据

                                                                                                                                                                                                                                       转载自:百度百科

      大数据(big data),是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。

在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)Veracity(真实性)。

一、定义

           对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

          麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

          大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

          从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

          随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

         大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。

二、特征

容量(Volume):数据的大小决定所考虑的数据的价值的和潜在的信息;

种类(Variety):数据类型的多样性;

速度(Velocity):指获得数据的速度;

可变性(Variability):妨碍了处理和有效地管理数据的过程。

真实性(Veracity):数据的质量

复杂性(Complexity):数据量巨大,来源多渠道
  

三、意义

      现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。阿里巴巴创办人马云来台演讲中就提到,未来的时代将不是IT时代,而是DT的时代,DT就是Data Technology数据科技,显示大数据对于阿里巴巴集团来说举足轻重。

      有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大规模数据是成为赢得竞争的关键。

     大数据的价值体现在以下几个方面:

              1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销;

              2) 做小而美模式的中长尾企业可以利用大数据做服务转型; 

              3) 面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值。

     不过,“大数据”在经济发展中的巨大意义并不代表其能取代一切对于社会问题的理性思考,科学发展的逻辑不能被湮没在海量数据中。著名经济学家路德维希·冯·米塞斯曾提醒过:“就今日言,有很多人忙碌于资料之无益累积,以致对问题之说明与解决,丧失了其对特殊的经济意义的了解。”这确实是需要警惕的。

四、结构

        大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。

 

        其次,想要系统的认知大数据,必须要全面而细致的分解它,我着手从三个层面来展开:

            第一层面是理论,理论是认知的必经途径,也是被广泛认同和传播的基线。在这里从大数据的特征定义理解行业对大数据的整体描绘和定性;从对大数据价值的探讨来深入解析大数据的珍贵所在;洞悉大数据的发展趋势;从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。

           第二层面是技术,技术是大数据价值体现的手段和前进的基石。在这里分别从云计算、分布式处理技术、存储技术和感知技术的发展来说明大数据从采集、处理、存储到形成结果的整个过程。

           第三层面是实践,实践是大数据的最终价值体现。在这里分别从互联网的大数据,政府的大数据,企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。

五、趋势

趋势一:数据的资源化

        何为资源化,是指大数据成为企业和社会关注的重要战略资源,并已成为大家争相抢夺的新焦点。因而,企业必须要提前制定大数据营销战略计划,抢占市场先机。

趋势二:与云计算的深度结合

       大数据离不开云处理,云处理为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一。自2013年开始,大数据技术已开始和云计算技术紧密结合,预计未来两者关系将更为密切。除此之外,物联网、移动互联网等新兴计算形态,也将一齐助力大数据革命,让大数据营销发挥出更大的影响力。

趋势三:科学理论的突破

        随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新一轮的技术革命。随之兴起的数据挖掘、机器学习和人工智能等相关技术,可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。

趋势四:数据科学和数据联盟的成立

        未来,数据科学将成为一门专门的学科,被越来越多的人所认知。各大高校将设立专门的数据科学类专业,也会催生一批与之相关的新的就业岗位。与此同时,基于数据这个基础平台,也将建立起跨领域的数据共享平台,之后,数据共享将扩展到企业层面,并且成为未来产业的核心一环。

趋势五:数据泄露泛滥

         未来几年数据泄露事件的增长率也许会达到100%,除非数据在其源头就能够得到安全保障。可以说,在未来,每个财富500强企业都会面临数据攻击,无论他们是否已经做好安全防范。而所有企业,无论规模大小,都需要重新审视今天的安全定义。在财富500强企业中,超过50%将会设置首席信息安全官这一职位。企业需要从新的角度来确保自身以及客户数据,所有数据在创建之初便需要获得安全保障,而并非在数据保存的最后一个环节,仅仅加强后者的安全措施已被证明于事无补。

趋势六:数据管理成为核心竞争力

        数据管理成为核心竞争力,直接影响财务表现。当“数据资产是企业核心资产”的概念深入人心之后,企业对于数据管理便有了更清晰的界定,将数据管理作为企业核心竞争力,持续发展,战略性规划与运用数据资产,成为企业数据管理的核心。数据资产管理效率与主营业务收入增长率、销售收入增长率显著正相关;此外,对于具有互联网思维的企业而言,数据资产竞争力所占比重为36.8%,数据资产的管理效果将直接影响企业的财务表现。

趋势七:数据质量是BI(商业智能)成功的关键

       采用自助式商业智能工具进行大数据处理的企业将会脱颖而出。其中要面临的一个挑战是,很多数据源会带来大量低质量数据。想要成功,企业需要理解原始数据与数据分析之间的差距,从而消除低质量数据并通过BI获得更佳决策。

趋势八:数据生态系统复合化程度加强

        大数据的世界不只是一个单一的、巨大的计算机网络,而是一个由大量活动构件与多元参与者元素所构成的生态系统,终端设备提供商、基础设施提供商、网络服务提供商、网络接入服务提供商、数据服务使能者、数据服务提供商、触点服务、数据服务零售商等等一系列的参与者共同构建的生态系统。而今,这样一套数据生态系统的基本雏形已然形成,接下来的发展将趋向于系统内部角色的细分,也就是市场的细分;系统机制的调整,也就是商业模式的创新;系统结构的调整,也就是竞争环境的调整等等,从而使得数据生态系统复合化程度逐渐增强。


http://baike.baidu.com/link?url=nw2lJOB_Ls5SgBlXa8gBKqujctUGw56igaTopgA0sLo1QD2DLAZBaWUAeet06yOcJ4I9hMwV9JY7__cdqxyZ4x48FOJ4wN9t4iU9ASL8nDq                                                                                                                                                                                                                                                                                                                                                               

确定要放弃本次机会?
福利倒计时
: :

立减 ¥

普通VIP年卡可用
立即使用
七O518
关注 关注
  • 1
    点赞
  • 踩
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
  • 分享
    复制链接
    分享到 QQ
    分享到新浪微博
    扫一扫
  • 举报
    举报
何为语言?信息又如何传播?
AI天才研究院
07-09 916
何为语言?信息又如何传播? 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming / TextGenWebUILLM 何为语言?信息又如何传播? 1. 背景介绍
何为大数据
C1pher_1的博客
09-29 974
何为大数据,广义上是指物理世界到数字世界的映射和提炼。通过发现其中的数据特征,从而做出提升效率的决策行为。狭义上,大数据是通过获取、存储、分析,从大容量数据中挖掘价值的一种全新的技术架构。定义表明大数据是那些拥有一系列关键特征的数据:容量、速度、多样性、低价值密度和真实性但也包括穷举性、分辨率、索引性、相关性、扩展性和可扩展性然而,这些定义缺乏本体论的清晰度,该术语充当了广泛选择的数据的无定形、包罗万象的标签。我认为大数据大体上可以用5个“V”定义。5V是指具有海量(Volume)、多样(Variety)、
参与评论 您还未登录,请先 登录 后发表或查看评论
什么是大数据?
weixin_44519124的博客
10-23 6835
什么是大数据? 字面意思理解:大量的数据,海量的数据 数据集的大小已经远远超过了现有普通数据库软件和工具的处理能力的数据 大数据有什么特点? 海量化 数据量大(多) 多样化 结构化数据,半结构化数据,和非结构化数据 快速化 数据的增长速度快 高价值 海量数据价值高 大数据能做什么? 1、海量数据快速查询 2、海量数据的存储(数据量大,单个大文件) 3、海量数据的...
什么是大数据概念
yujianta14的博客
04-25 5857
现在说起大数据,那是相当火的“时髦词”,大家在炒概念,大数据并不难,怎样利用大数据还是很难得,在我看来,目前很多人都在吹嘘大数据。但是真正懂大数据的人却寥寥无几
何为大数据?
cigang4063的博客
02-11 167
  大数据,或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大,以至于无法在合理时间内通过人工截取、管理、处理并整理成为人类所能解读的信息。  有人把大数据的特征归纳为量大、多样、高速、价值密度低。以“双十一”为例,淘宝商城当日达成近两亿笔交易,总交易额达创纪录的350余亿元。这些交...
何为大数据.docx
12-24
大数据,这个概念在当今信息化社会中扮演着至关重要的角色。大数据指的是那些无法通过传统方法处理的海量、高速、多源、多格式的数据集合。这些数据的规模和复杂性需要先进的技术和算法来挖掘其中的价值。大数据的...
何为捷径?文章-需求.docx
05-18
无论是编程语言的迭代,还是新兴的AI、大数据、区块链等领域,都需要开发者保持持久的学习热情,不断探索和实践。只有这样,才能在竞争激烈的行业中保持竞争力,走出属于自己的成功之路。 此外,我们还需要注意到,...
网络存储:何为主流?
03-04
SAN通常使用FC(Fibre Channel)或其他高速协议,提供高带宽和低延迟,适用于大数据和关键业务环境。同时,SAN具有优秀的可扩展性,能够无缝添加新的存储设备,确保系统的灵活性和稳定性。 总结来说,DAS、NAS和SAN...
何为大数据架构?
测试0901-1
04-17 474
大数据架构是用以提取和处理海量数据(一般称之为“大数据”)的整体系统,因而能够针对业务目的进行分析整理。该架构可视作基于机构业务需求的大数据解决方案的蓝图。 大数据架构旨在处理下列类别的业务: •批量处理大数据源。 •实时处理大数据。 •分析预测和机器学习。 大数据架构的好处 可用以分析的数据量每日都在增长。并且,流媒体资源比过去更多,其中包括流量传感器...
何谓大数据?
学无止境
12-24 1573
"大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。  何谓"大数据"? 1、首先是指数据体量(volumes)大,指代大型数据集,一般在10TB?规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量; 2、其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破
何为大数据概念 大数据分析
中琛魔方大数据
04-08 746
  大数据里面包含很多如大数据时代、大数据概念、大数据分析、大数据营销与开发到底是什么意思呢?所谓大数据,那到底什么是大数据,他的来源在哪里,定义究竟是什么呢?下面中琛魔方为您详细解答,一起来看看吧   方法/步骤   1.大数据的定义。大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策...
什么是大数据?一文讲清大数据的概念、演进、趋势、产业链及关键技术!
热门推荐
ccddtomato的专栏
09-20 4万+
大数据这个词,不管您是不是相关行业的从业者,也都听过无数遍了,但对于大多数人来说,并不能清楚的讲出什么是大数据。今天小兵尝试通过通俗的语言,结合贴近生活的例子,将大数据及相关的概念一次讲清楚。
大数据的含义
最新发布
dian112211的博客
12-06 720
大数据(Big Data)是指数据量巨大、类型多样、处理速度快、价值密度低的数据集合。大数据的概念不仅仅局限于数据的规模,还包括数据的多样性、速度和真实性。大数据的应用非常广泛,包括但不限于商业智能、金融风险管理、医疗健康、交通规划、社交网络分析等领域。通过大数据技术,企业和组织能够从海量数据中提取有价值的信息,支持决策制定,优化业务流程,提高效率和竞争力。:数据类型繁多,包括结构化数据、半结构化数据和非结构化数据,如文本、图片、视频、日志文件等。:数据的准确性和质量,确保数据的真实性和可靠性。
大数据的概念
fhb1922702569的博客
02-24 9350
1、大数据定义   对于“大数据”(Big data)研究机构Gartner给出了定义,“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力 的海量、高增长率和多样化的信息资产。 大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力
大数据分析(一) 何为聚类?何为分类?
zonghengxueba的博客
08-09 4765
一. 何为分类 分类在我们日常生活中其实很普遍,其实我们与生俱来的能力就包括分类,从我们小时候慢慢长大,大脑就慢慢训练怎么分类,设置模型,对应模型这些,这就是一种分类的过程。比如说,我们在路上看见了车,车这这么一种物体,我们大脑看见这种物体之后,根据物体的大小,我们可以分为大汽车,小汽车,巨型车等等,这就是一种分类的过程。也可以根据车型的价格分为低端车,中端车,豪华车等等。这些其实都是一种分类的...
什么是大数据?大数据用来干嘛?
优快云19970806的博客
06-13 3万+
1、何为大数据?大数据是指很多很多的数据,主要源于web2.0之后,数据库中的数据量累计起来很庞大,在对数据进行操作(主要指查询)会变得很慢,对机器的性能要求会很高,如果数据量达到足够大(如十几亿),那服务器会崩溃的2、大数据解决什么问题?大数据解决对海量数据的存储、查询、分析计算等操作,主要应用在利用庞大的数据归类分析用户的偏好,利用用户的历史信息得出相应的统计账单等,将同行业的大公司的数据进行...
七O518

博客等级

码龄10年
2
原创
4
点赞
5
收藏
1
粉丝
关注
私信

热门文章

  • 大数据的特点:5个V 22294
  • 从存储角度看大数据和云计算区别与联系 1889
  • 对大数据信息挖掘、分析的浅显认识 995
  • 何为大数据? 842
  • Oracle大数据解决方案。 822
下一篇:
对大数据信息挖掘、分析的浅显认识

最新评论

  • 大数据的特点:5个V

    jadenlin: 你連Veracity都缺乏真實性...

  • 大数据的特点:5个V

    洞幺007: 这不是5个v吗,第6个呢

大家在看

  • 基于GPT-4o的免费AI绘图神器来了!与官方效果完全一致,支持多种创作模式 1

最新文章

  • Oracle大数据解决方案。
  • 大数据的实际应用。
  • Hadoop与MapReduce。
2015年9篇

目录

展开全部

收起

目录

展开全部

收起

下一篇:
对大数据信息挖掘、分析的浅显认识

最新文章

  • Oracle大数据解决方案。
  • 大数据的实际应用。
  • Hadoop与MapReduce。
2015年9篇

目录

评论
被折叠的  条评论 为什么被折叠? 到【灌水乐园】发言
查看更多评论
添加红包

请填写红包祝福语或标题

个

红包个数最小为10个

元

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00元
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付元
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值