
大数据项目经验
文章平均质量分 68
codemosi
hadoop hive hbase mahout storm spark kafka flume,等连载中,做个爱分享的人。
干一件事,干好一件事!
QQ :1606588828
展开
-
2014半年小总结(转载)
已经毕业工作快满两年了,从一家垄断国字号企业跳到某电商平台,应该是我的职业生涯第一跳了,也很荣幸地投身入互联网浪潮之中。没过多久就融入了这家朝气蓬勃的大家庭。回汉后,起初打算做机器学习、数据挖掘的相关工作,以能延续研究生的课题。不过作为新东家BI组第一位员工,不得不着手搭建基础数据平台。工作成果与心得基础数据平台和报表系统,爬虫五个月,小半年,我们三兄弟的工作成转载 2015-01-07 15:50:08 · 582 阅读 · 0 评论 -
大数据如何改变教育(转载)
大数据如何改变教育 “不得不承认,对于学生,我们知道得太少”——这是卡耐基• 梅隆大学(Carnegie Mellon University)教育学院介绍中的一句自白,也同样是美国十大教育类年会中出镜率最高的核心议题。 在大多数教研活动中,评判一个课堂的好坏,更多是专家审美型的——教师的环节设计是否层层递进,提出的问题是否有效,环节设置与本节活动的目标是否契合转载 2015-02-11 15:32:41 · 843 阅读 · 0 评论 -
海量数据处理:十道面试题与十个海量数据处理方法总结(转载)
作者:July、youwang、yanxionglu。时间:二零一一年三月二十六日本文之总结:教你如何迅速秒杀掉:99%的海量数据处理面试题。有任何问题,欢迎随时交流、指正。出处:http://blog.youkuaiyun.com/v_JULY_v。 第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首转载 2015-02-25 18:38:34 · 646 阅读 · 0 评论 -
用户画像数据建模方法
从1991年Tim Berners-Lee发明了万维网(World Wide Web)开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了“大数据时代”。经历了12、13两年热炒之后,人们逐渐冷静下来,更加聚焦于如何利用大数据挖掘潜在的商业价值,如何在企业中实实在在的应用大数据技术。伴随着大数据应用的讨论、创新,个性化技术成为了一个重要落地点。相比传统的线下会员管理、问卷调查、购物篮转载 2015-03-05 11:58:38 · 1544 阅读 · 0 评论 -
Presto实现原理和美团的使用实践(转载)
Facebook的数据仓库存储在少量大型Hadoop/HDFS集群。Hive是Facebook在几年前专为Hadoop打造的一款数据仓库工具。在以前,Facebook的科学家和分析师一直依靠Hive来做数据分析。但Hive使用MapReduce作为底层计算框架,是专为批处理设计的。但随着数据越来越多,使用Hive进行一个简单的数据查询可能要花费几分到几小时,显然不能满足交互式查询的需求。Faceb转载 2015-03-13 10:42:21 · 808 阅读 · 0 评论 -
五种常用基数估计算法效果实验及实践建议
之前我曾写过一系列关于基数估计(cardinality estimation)算法的文章,文中介绍了一些常用基数估计算法的原理。最近对常用的基数估计算法做了一些实验,这篇文章描述了实验结果,包括这些算法的估计效果及误差状况,主要通过图表展示。通过观察实验数据和可视化图表可以加强对各种基数估计算法理论分析的直观理解。文章首先会对实验做一些说明,然后通过图表详细展示实验数据,最后会根据实验结果转载 2015-03-13 10:17:34 · 1258 阅读 · 1 评论 -
宽表和窄表的建设该如何选择?
这个问题相信纠结了很多从是数据库开发、数据仓库开发和后台开发人员;单单考虑这个问题,难给出一个绝对的答案;本人从事数据仓库开发工作到现在已经有一年半时间了,对于这个问题,我也曾经纠结过,但是是否有绝对的答案呢?事实上任何东西都没有绝对的说法。考虑这样的一个问题,一个公司有这样的一个需求:设计销售领域的订单事实表,该事实表应该包含哪些维度和度量?事实表和维表该分别如何去设计?转载 2015-03-12 11:38:44 · 3555 阅读 · 0 评论 -
2016年大战双11 总结
今年双11,0点干通宵,PD直接倒地,老大也战斗到凌晨,全部帐篷解决温饱问题。各位都非常棒。CTO还来慰问了,无耻的合了个照,来年再战。实在太累,回去睡觉,总结明日再写。最后招聘 java+storm 开发人员。简历发到QQ:1606588828,欢迎新队友,共战亿万级实时计算。原创 2016-11-11 20:56:49 · 1190 阅读 · 0 评论