机器学习
文章平均质量分 89
一寒惊鸿
阿里算法工程师,聚焦于人工智能这一璀璨的星辰,致力于在数据的海洋中寻找智慧的珍珠。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【算法】算法知识点总结
## 项目知识点评估:1、fm + ffm + lr # fm 相比 lr 引进了特征组合(二次项) # fm 解决了数据稀疏性导致的参数训练不充分问题(尤其对于one-hot编码之后) # ffm 增加了field,隐向量不仅与特征相关,也与field相关 # 假设样本的 n 个特征属于 f 个field,那么FFM的二次项有 nf个隐向量。 # 而在FM模型中,每一维特征的...原创 2018-03-27 10:13:57 · 1842 阅读 · 1 评论 -
【方法】实例详解机器学习如何解决问题
来源:http://tech.meituan.com/mt-mlinaction-how-to-ml.html前言随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具。不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是学术界和工业界对机器学习的研究各有侧重,学术界侧重于对机器学习理论的研究,工业界侧重于如何用机器学习来解决实际问题。我们结合美团在机器学习上原创 2017-03-16 19:20:25 · 23878 阅读 · 0 评论 -
【方法】搜索排序评估方法
在策略相关的产品如搜索、排序、推荐等功能的评估中,除了一般性数据分析方法之外,还有有一些特有的且相对比较固定的评估工具,这些评估工具都取之于信息检索科学的常用评估方法。要了解这些首先要了解策略产品的效果评估,我们必须要引入一些必要的信息检索相关的知识。1.召回率和准确率信息检索领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率原创 2017-06-09 10:06:14 · 29068 阅读 · 0 评论 -
【算法】机器学习之常用算法
朴素贝叶斯:有以下几个地方需要注意:1. 如果给出的特征向量长度可能不同,这是需要归一化为通长度的向量(这里以文本分类为例),比如说是句子单词的话,则长度为整个词汇量的长度,对应位置是该单词出现的次数。2. 计算公式如下:其中一项条件概率可以通过朴素贝叶斯条件独立展开。要注意一点就是的计算方法,而由朴素贝叶斯的前提假设可知,=,因此一般有两种,一种是在类别为ci的那些样本集中,原创 2017-01-18 13:23:59 · 23175 阅读 · 0 评论 -
【方法】不平衡数据下的机器学习方法
原文:http://www.jianshu.com/p/3e8b9f2764c8引言不管是在学术界还是工业界,不平衡学习已经吸引了越来越多的关注,不平衡数据的场景也出现在互联网应用的方方面面,如搜索引擎的点击预测(点击的网页往往占据很小的比例),电子商务领域的商品推荐(推荐的商品被购买的比例很低),信用卡欺诈检测,网络攻击识别等等。问题定义那么什么是不平衡数据呢?顾名思转载 2017-03-10 17:37:26 · 26373 阅读 · 0 评论 -
【方法】机器学习中的数据清洗与特征处理
来源:http://tech.meituan.com/machinelearning-data-feature-process.html背景随着美团交易规模的逐步增大,积累下来的业务数据和交易数据越来越多,这些数据是美团做为一个团购平台最宝贵的财富。通过对这些数据的分析和挖掘,不仅能给美团业务发展方向提供决策支持,也为业务的迭代指明了方向。目前在美团的团购系统中大量地应用到了机器学转载 2017-03-16 19:18:01 · 29849 阅读 · 0 评论 -
【算法】Learning to rank小结
本博文包括以下内容Learning to rank 基本方法Learning to rank 指标介绍LambdaMART 模型原理FTRL 模型原理learning to rank排序学习是推荐、搜索、广告的核心方法。排序结果的好坏很大程度影响用户体验、广告收入等。排序学习可以理解为机器学习中用户排序的方法,这里首先推荐一本微软亚洲研究院刘铁岩老师关于LTR的著作,Lea转载 2017-06-09 10:02:58 · 26569 阅读 · 0 评论
分享