
大数据/云计算
pinjer
性格开朗、积极向上、好动手、专注前言技术!
展开
-
关于YARN的几篇文章推荐
1、YARN 简介(2014-12)http://www.ibm.com/developerworks/cn/data/library/bd-yarn-intro/2、Hadoop 新MapReduce 框架Yarn 详解(带有实例)(2013-1)http://www.ibm.com/developerworks/cn/opensource/os-cn-had转载 2015-02-11 22:57:13 · 732 阅读 · 0 评论 -
druid简单教程
版权声明:本文为博主原创文章,未经博主允许不得转载。目录(?)[+]Java程序很大一部分要操作数据库,为了提高性能操作数据库的时候,有不得不使用数据库连接池。数据库连接池有很多选择,c3p、dhcp、proxool等,druid作为一名后起之秀,凭借其出色的性能,也逐渐印入了大家的眼帘。接下来本教程就说一下druid的简单使用。 首先从http://r转载 2016-05-23 08:45:38 · 764 阅读 · 0 评论 -
淘宝druid数据库连接池使用示例
参考:淘宝连接池Druid http://www.zhurouyoudu.com/index.php/archives/635/http://code.alibabatech.com/wiki/display/Druid/Homedruid使用 http://blog.youkuaiyun.com/yunnysunny/article/details/8657095转载 2016-05-23 08:40:38 · 3626 阅读 · 0 评论 -
navicat进行数据库备份
需要对MySQL数据库进行每日备份,网上有很多写批处理或者命令行进行备份的方法,不过这里介绍一下用Navicat工具进行备份的方法,傻瓜操作,非常简单。如图,连同系统数据库,总共有12个数据库,现在介绍一下将这12个数据库全部备份的方法:点击“计划” ->”新建批处理作业"默认就有“Backup Server Localhos转载 2016-04-29 08:35:24 · 7757 阅读 · 0 评论 -
近200篇机器学习&深度学习资料分享(含各种文档,视频,源码等)
编者按:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等。而且原文也会不定期的更新,望看到文章的朋友能够学到更多。《Brief History of Machine Learning》介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost 到随机森林、Deep Learning.《Deep Learnin转载 2015-04-18 15:03:19 · 3098 阅读 · 0 评论 -
BAT大数据相关博客
一、阿里系列1、量子恒道官方博客2、原创 2015-04-18 14:55:14 · 606 阅读 · 0 评论 -
Spark:一个高效的分布式计算系统
概述什么是SparkSpark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习转载 2015-02-12 00:19:47 · 795 阅读 · 1 评论 -
YARN产生背景
Hadoop1.x中的MapReduce构成图如下:在Hadoop1.x中MapReduce是Master/Slave结构,在集群中的表现形式为:1个JobTracker带多个TaskTracker;JobTracker:负责资源管理和作业调度;TaskTracker:定期向JobTracker汇报本节点的健康状况、资源使用情况以及任务的执行情况;接收来自JobTr转载 2015-02-11 23:48:43 · 1718 阅读 · 0 评论 -
hadoop生态系统引见
1、Hadoop生态系统概况Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。Hadoop的核心是HDFS和Mapreduce,hadoop2.0还包括YARN。下图为hadoop的生态系统: 2、HDFS(Hadoop分布式文件系统)源自于Google的GFS论文,发表于2003年10月,HDFS是GF转载 2015-02-12 00:08:42 · 728 阅读 · 0 评论 -
Hadoop已经成为大数据分析平台的标配
【优快云报道】5月29日,“2013中国·北京第一届(国际)开源大会”在北京新世纪日航酒店拉开帷幕,本次大会以大力发展并推动北京科技原创能力为宗旨,以“开源中国 原创北京”为主题,通过丰富前瞻性的思想盛宴,让北京在世界科技发展新趋势下占据主动地位。下文是Hadoop专场侧记:Hadoop中国开源社区下午Hadoop专场的第一位嘉宾是来自ChinaHadoop社区负责人谢磊,他转载 2015-02-11 23:13:27 · 1314 阅读 · 0 评论 -
Yahoo! 的新一代大数据技术架构解析
Hadoop是当前最流行的大数据技术架构,很多大数据应用都是建立在Hadoop平台基础之上。很多人都知道Hadoop是Apache基金会的顶级开源项目,但并不是每个人都知道,在Hadoop的演进发展中,70%的贡献是来自Yahoo!公司。Yahoo!公司是Hadoop平台最大的用户、最有力的应用支持者和Hadoop商业化的重要推动者,Hadoop一直是Yahoo!公司云计算平台的核心,Ya转载 2015-02-11 23:09:34 · 1607 阅读 · 0 评论 -
基础篇:Hadoop组件与生态系统介绍
从2014年开始,大数据逐渐发展壮大起来。越来越多的公司开始使用大数据,包括日常事务管理及复杂业务方案探究。大数据已经很快地从一个被夸大的词汇转变成了一个可行的技术,无论业务规模是大还是小。 大数据,简单来说就是存在于我们身边的大量数据,如智能终端、网络应用、社交媒体、聊天室、移动App、通讯记录、支付历史以及各种其他方式涉及到的数据。大数据技术对大量的信息进行整合、存储以及分析,数据量转载 2015-02-11 22:52:26 · 3947 阅读 · 0 评论 -
六个超大规模Hadoop部署案例-Hadoop
据估量,到2015年,全世界一半以上的数据将涉及Hadoop--围绕这个开源平台的生态系统日益庞大,这有力地印证了这个惊人的数字。 然而,有些人表示,虽然Hadoop是眼下热闹非凡的大数据领域最热话题,但它肯定不是可以解决数据中央和数据治理方面所有难题的灵丹妙药。考虑到这一点,我们暂且不想推测这个平台未来会怎样,也不想推测彻底改变种种数据麋集型解决方案的开源技术未来会怎样,而是关注让Ha转载 2015-02-11 22:50:31 · 3888 阅读 · 0 评论 -
云平台的几个概念和典型平台关系对比
近期总有朋友咨询各类云平台的性能和相互关系,现整理出几个概念,希望对大家能有帮助:理解云平台要从三个层次来理解,同时考虑其是开源还是闭源的:1、IaaS(Infrastructure as a Service:基础设施即服务),代表企业有Amazon, Microsoft, VMWare, Rackspace和Red Hat。开源代表产品有:OpenStack、CloudStack、E转载 2015-02-11 22:48:06 · 13329 阅读 · 0 评论 -
Hadoop+Spark+MongoDB+MySQL+C#大数据开发项目最佳实践
转自:http://www.thebigdata.cn/Hadoop/31402.html一、前言 随着IT技术的飞速发展,各行各业都已在广泛尝试使用大数据技术提供更稳健和优质的服务。目前,医疗IT系统收集了大量极具价值的数据,但这些历史医疗数据并没有发挥出其应有的价值。为此 ,本文拟利用医院现有的历史数据,挖掘出有价值的基于统计学的医学规则、知识,并 基于这些信息构建专业的临床转载 2016-10-12 15:25:30 · 9148 阅读 · 1 评论