
机器学习
文章平均质量分 85
smarthhl
大数据架构师
展开
-
互联网金融数据分析应用
转摘自:http://bbs.easysoo.cn/?p=476互联网金融在国内发展也才2年多的时间,从货币基金到P2P到众筹到股票基金,从传统ATM和手机银行短信银行,感慨这个互联网金融的到来,让我们有更多的信息渠道可以来了解金额。还有像越女读财介绍的高暴利的钱宝网、MMM、百川币这些,如果没有互联网,相信他们也很难发展的起来。主要介绍下互联网金融行业的相关公司主要应用的数据转载 2016-01-19 22:45:50 · 2433 阅读 · 0 评论 -
机器学习:你需要多少训练数据?
作者为Google 软件工程师,美国西北大学电子信息工程博士,擅长大规模分布式系统,编译器和数据库。从谷歌的机器学习代码中得知,目前需要一万亿个训练样本训练数据的特性和数量是决定一个模型性能好坏的最主要因素。一旦你对一个模型输入比较全面的训练数据,通常针对这些训练数据,模型也会产生相应的结果。但是,问题是你需要多少训练数据合适呢?这恰恰取决于你原创 2015-12-22 23:02:01 · 6607 阅读 · 0 评论 -
数据分析师常见的十道面试题目
数据分析师常见的10道面试题及解答1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大的几个)及原创 2015-12-23 23:02:58 · 8613 阅读 · 1 评论 -
机器学习系列 -- 丈母娘选女婿
作者:龙心尘 &&寒小阳时间:2016年1月。 出处: http://blog.youkuaiyun.com/longxinchen_ml/article/details/50471682http://blog.youkuaiyun.com/han_xiaoyang/article/details/50481967声明:版权所有,转载请联系作者并注明出处1. 引言再过一个月就是春节转载 2016-01-15 10:09:30 · 742 阅读 · 0 评论 -
solr的两种安装方式
安装模式StandaloneSolrCloud安装yuminstall lucidworks-hdpsearchwget https://issues.apache.org/jira/secure/attachment/12761323/solr_for_audit_setup_v3.tgz-O /usr/local/solr_for_audit_s原创 2016-12-21 11:04:55 · 2497 阅读 · 0 评论