
大数据分析
zhongwen7710
这个作者很懒,什么都没留下…
展开
-
海量数据框架变迁——阿里巴巴上市背后的技术力量
阿里巴巴的上市,这不仅是商业和资本领域的一件大事,对于技术世界也是如此,在阿里巴巴的30位合伙人中,我们可以看到多位技术人员的影子,比如阿里巴巴集团CTO王坚,小微金融服务集团CTO程立(花名鲁肃),阿里巴巴集团副首席技术官姜鹏(花名三丰),阿里云高级研究员蔡景现(花名多隆),阿里巴巴集团技术保障、安全技术产品部副总裁刘振飞等。自从人类发明了计算机,技术人的世界就是那么让人痴迷原创 2014-10-06 23:30:12 · 1895 阅读 · 0 评论 -
数据分析师面试常见的77个问题
随着大数据概念的火热,数据科学家这一职位应时而出,那么成为数据科学家要满足什么条件?或许我们可以从国外的数据科学家面试问题中得到一些参考,下面是77个关于数据分析或者数据科学家招聘的时候会常会的几个问题,供各位同行参考。1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的?3、什么是:提升值、关键绩转载 2014-10-07 20:26:15 · 7650 阅读 · 0 评论 -
大数据数据处理模型——怎样构建一个有指导的数据挖掘模型
数据挖掘的目的,就是从数据中找到更多的优质用户。接着上篇继续探讨有指导数据挖掘方法模型。什么是有指导的数据挖掘方法模型,以及数据挖掘如何构建模型。在构建一个有指导的数据挖掘模型,首先要理解和定义一些模型试图估计的目标变量。一个典型的案例,二元响应模型,如为直接邮寄和电子邮件营销活动选择客户的模型。模型的构建选择历史客户数据,这些客户响应了以前类似的活动。有指导数据挖掘的目的就是找到更多类似的客户,原创 2014-10-04 15:35:55 · 2567 阅读 · 0 评论 -
汇总从代数角度与几何角度理解相似度计算方法(以机器学习Mahout框架为主线)
相似度的计算是数据挖掘与机器学习中的一个永恒的话题,为了能更好地理解与比较各种相似度计算的方法,能灵活运用到各种计算模型中,自己在研究机器学习之Mahout框架时,源代码中也实现了很多相似度计算方法,本文结合机器学习Mahout框架中各种相似度计算方法的实现,并且从代数角度和几何角度来理解相似度的计算方法。并阐述其优缺点,及自己的适用场景。本文通过总结和归纳,一共总结了9中距离测量方法,方法一到方法七是Mahout中完完本本实现了,其中前面是方面名,破折号后是Mahout中各方法实现的类名,本文结合Maho原创 2014-12-22 22:57:37 · 5934 阅读 · 0 评论 -
【重磅干货整理】机器学习(Machine Learning)与深度学习(Deep Learning)资料汇总
《Brief History of Machine Learning》介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning.《Deep Learning in Neural Networks: An Overview》介绍:这是瑞士人工智能实验室Jurgen Schmidhuber写的最原创 2015-04-28 10:17:32 · 31287 阅读 · 12 评论