
机器学习
文章平均质量分 76
抖腿大刘
我很懒,啥都不写
展开
-
#论文阅读#Amazon.com Recommendations: Item-to-item collaborative filtering
其实就是基本的item cf 的算法,和教材中讲的差不多,算法实现没有什么好赘述的,只是记录下在引言中看到的原来不知道的部分。首先是电商推荐面临的一些挑战,说的都是比较普遍的,但是其实针对不同的业务有不同的挑战: 数据量大:A large retailer might have huge amounts of data, tens of millions of customers ...原创 2019-04-12 20:11:05 · 784 阅读 · 0 评论 -
Pooled GRU + FastText 实现多标签的代码阅读
背景知识点embedingkeras Text Preprocessing Tokenizerkeras.preprocessing.sequence.pad_sequenceskeras.layers.Inputkeras.layers.Embeddingkeras.layers.SpatialDropout1Dkeras.layers.Densekeras....原创 2019-03-13 01:32:19 · 1881 阅读 · 0 评论 -
【论文阅读】Ranking Relevance in Yahoo Search
论文进行问题 -》 方法 -》 评价 -》 结论问题 - 商业检索问题:一般:相关性问题:基于文本 ---问题---》 query 和 doc 语义 上的 gap ; QA 系统中的 query understanding(个人感觉和第一个问题类似)基于用户行为 --问题--》 tail query转化率问题:时效问题距离问题.....用户体验:坏的...原创 2019-02-19 17:20:46 · 1106 阅读 · 0 评论 -
机器学习岗位面试问题汇总 之 集成学习
自己结合网络内容总结,欢迎指正欢迎补充。最新更新:20170626—版本1(只给出问题)总体性问题1.学习器结合可能带来的好处2.模型融合的方法/策略3.常见融合框架的原理;优缺点;融合一定会提升性能么?为什么融合可能会提高预测效果?4.Bagging 和 Boosting 的区别和联系5.为什么说Bagging是减少了方差(variance),而Boosting是减少了偏差(bias)?R F6.原创 2017-06-26 20:05:29 · 2896 阅读 · 0 评论 -
机器学习岗位面试问题汇总 之 总体性问题
自己结合网络内容总结,欢迎指正欢迎补充。最新更新:20170627—版本2(扩充问题,取消简易答案)1.机器学习、模式识别、深度学习的关系2.解释监督学习、非监督学习、半监督学习的关系3.机器学习模型分类 之 监督/非监督4.机器学习模型分类 之 回归/分类/标注5.机器学习模型分类 之 判别模型/生成模型6.生成模型、判别模型的区别?各自的优缺点?7.AUC的本质是什么?AUC有哪些原创 2017-06-05 18:03:05 · 708 阅读 · 0 评论 -
谷歌页面排序算法
论文地址: 百度学术上不去!!!相关博文: http://www.mahaixiang.cn/seoyjy/812.html http://www.mahaixiang.cn/seoyjy/5.html原创 2017-04-18 17:01:31 · 1498 阅读 · 0 评论 -
机器学习实战+统计学习方法之理解KNN(1.实战代码的详细走读和解析)
机器学习实战2.2.1:实施KNN算法# the program is general from 2.1.2~#_init_py is described is a 构造函数 constructed function'''wrong things: 1.gourp [ [],[] ] in the outermost the [] 2.dataSet.shape[原创 2017-04-10 21:32:54 · 900 阅读 · 0 评论