
机器学习
机器不学习_
深度聚合机器学习、人工智能算法及技术实战
展开
-
GBDT(MART) 迭代决策树入门教程
在网上看到一篇对从代码层面理解gbdt比较好的文章,转载记录一下: GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(generali转载 2014-04-19 20:30:16 · 1158 阅读 · 0 评论 -
协同过滤
准确率 召回率 覆盖率 平均流行度1.基于领域的算法a.基于用户的协同过滤算法 --- 计算复杂度比较高 步骤:1.找到和目标用户兴趣相似的用户集合-----统计当前用户中的物品类似的 2.找到这个集合汇总用户喜欢,并且目标用户没有听说的物品推荐给目标用户 计算u和v的兴趣相似度jaccard公式(交/并)和预先相似度()b.基于物品的协原创 2014-05-09 21:39:45 · 588 阅读 · 0 评论 -
Building decision trees to identify the intent
数据:自于日志,人工进行分类。Feature Analysis1.Number of terms in the query (nterms),2.Number of clicks in query sessions(nclicks),a significant number of navigational queries concentrates only a few clicks p原创 2014-04-24 21:46:45 · 450 阅读 · 0 评论 -
逻辑回归
二元逻辑回归(Logistic Regression, LR)模型几率(odds:对数形式:基于LR的点击率预测Where, x代表一个(query, ad)对应的特征向量, y 属于{1,0}分别代表点击和不点击,p(y=1|x)就代 表给定query下,某ad的点击率点击率预测特征广告创意特征:图片,标题文字,价格,销量 推广商品所属原创 2014-04-24 21:34:56 · 1030 阅读 · 0 评论 -
特征值分解和SVD
特征值分解如果说一个向量v是方阵A的特征向量,将一定可以表示成下面的形式: 这时候λ就被称为特征向量v对应的特征值,一个矩阵的一组特征向量是一组正交向量。特征值分解是将一个矩阵分解成下面的形式: 其中Q是这个矩阵A的特征向量组成的矩阵,Σ是一个对角阵,每一个对角线上的元素就是一个特征值。我这里引用了一些参考文献中的内容来说明一下。首先,要明确的是,一个矩阵其实就是原创 2016-04-25 10:16:55 · 9757 阅读 · 0 评论 -
SVD建模
以MovieLens电影推荐为例,SVD(Singular Value Decomposition)的想法是根据已有的评分情况,分析出评分者对各个因子的喜好程度以及电影包含各个因子的程度,最后再反过来根据分析结果。使用SVD对问题进行建模SVD的想法抽象点来看就是将一个N行M列的评分矩阵R(R[u][i]代表第u个用户对第i个物品的评分),分解成一个N行F列的用户因子矩阵P(P[u][k]表示用户u原创 2016-04-25 11:46:25 · 5544 阅读 · 0 评论 -
协同过滤--基于物品的推荐案例
数据集字段: 1.User_id: 用户ID 2.Item_id: 物品ID 3.preference:用户对该物品的评分 算法的思想: 1. 建立物品的同现矩阵A,即统计两两物品同时出现的次数. 数据格式:Item_id1:Item_id2 次数 2. 建立用户对物品的评分矩阵B,即每一个用户对某一物品的评分. 数据格式:Item_id user_i原创 2016-04-22 17:52:27 · 2451 阅读 · 0 评论 -
协同过滤理论
基于用户的 CF(User CF)基于用户的 CF 的基本思想相当简单,基于用户对物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户。计算上,就是将一个用户对所有物品的偏好作为一个向量 来计算用户之间的相似度,找到 K 邻居后,根据邻居的相似度权重以及他们对物品的偏好,预测当前用户没有偏好的未涉及物品,计算得到一个排序的物品列表作为推荐。图 2 给出了一个例子,对于用户 A,根据用户的历原创 2016-04-22 17:36:23 · 648 阅读 · 0 评论 -
协同过滤-音乐推荐
一.协同过滤算法基于用户的协同过滤算法:这种算法最大的问题如何判断并量化两人的相似性,思路是这样 例子: 有3首歌放在那里,《最炫民族风》,《晴天》,《Hero》。 A君,收藏了《最炫民族风》,而遇到《晴天》,《Hero》则总是跳过; B君,经常单曲循环《最炫民族风》,《晴天》会播放完,《Hero》则拉黑了 C君,拉黑了《最炫民族风》,而《晴天》《Hero》都收藏了。 我们都看出来了,A原创 2016-04-23 15:32:55 · 8728 阅读 · 1 评论