
大数据
文章平均质量分 83
长安-TreeHole
这个作者很懒,什么都没留下…
展开
-
二、大数据技术之Hadoop --从Hadoop框架讨论大数据生态
1、从Hadoop框架讨论大数据生态 1.1 Hadoop是什么 1)Hadoop是一个又Apache基金会开发的分布式系统基础架构。 2)主要解决:海量数据的存储和海量数据的分析计算问题。 3)广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。 1.2 Hadoop发展历史 1)Lucene框架是Doug Cutting开创的开源软件,用Java书写代码,实现与Google类似的全文搜索功能,它提供了全文检索引擎的架构,包括完整的查询引擎和索引引擎。 Hadoo原创 2021-04-22 12:08:39 · 650 阅读 · 1 评论 -
一、大数据技术 --概论
1、大数据概论 1.1 大数据概念 大数据(Big Data):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 主要解决:海量数据的存储和海量数据的分析计算问题。 数据的存储单位(由小到大):bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。 1Byte=8bit 1K=1024Byte 1M=1024K 1G=10...原创 2021-04-09 08:54:48 · 616 阅读 · 0 评论