
机器学习
乖乖猪001
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pip下载报错:pip._vendor.urllib3.exceptions.SSLError: [SSL: DECRYPTION_FAILED_OR_BAD_RECORD_MAC] decry
pip下载报错:pip下载命令如下:sudo pip3 install keras-bert -i https://pypi.tuna.tsinghua.edu.cn/simple/报错内容:pip._vendor.urllib3.exceptions.SSLError: [SSL: DECRYPTION_FAILED_OR_BAD_RECORD_MAC] decryption failed or bad record mac (_ssl.c:2629)解决思路:默认超时时间15s,可加原创 2022-05-09 17:39:39 · 3883 阅读 · 0 评论 -
召回以后排序的目的
召回层一般都没用到标签信息的,一些简单召回使用的信息非常有限,即使用有监督训练得到的向量,也无法包含context的信息。一般情况,召回大都是协同过滤:物品基于用户互动行为所产生的相似性(Item based,user base同理)。那如果两个物品在这种行为上的相似性是相近的,就无法区分其推荐评分的高低了。召回主要作用还是大范围的减小候选集,使得后续的精排算法在计算压力上减轻很多,就获取信息能力而言,CF还是有其局限性。排序就比较多了。context信息,包括单特征的交叉信息(LR没法自动做交叉,需要手原创 2021-03-30 14:36:17 · 306 阅读 · 0 评论 -
深度长文 | 从FM推演各深度CTR预估模型
深度长文 | 从FM推演各深度CTR预估模型(附开源代码)深度学习在CTR预估中的应用转载 2021-01-05 15:20:29 · 153 阅读 · 0 评论 -
FM系列算法(FM/FFM/DeepFM)
综述 在计算广告中,CTR是非常重要的一环。对于特征组合来说,业界通用的做法主要有两大类:FM系列和Tree系列。这里我们来介绍一下FM系列。 在传统的线性模型中,每个特征都是独立的,如果需要考虑特征与特征之间的相互作用,可能需要人工对特征进行交叉组合。非线性SVM可以对特征进行核变换,但是在特征高度稀疏的情况下,并不能很好的进行学习。现在有很多分解模型可以学习到特征之间的交互隐藏关系,基本上每个模型都只适用于特定的输入和场景。推荐系统是一个高度系数的数据场景,由此产生了FM系列算法。 本文主要转载 2020-12-11 11:37:48 · 692 阅读 · 0 评论 -
Spark实现K-means
Q:无监督学习和有监督学习定义和区别A:有监督学习:提供数据并提供数据对应结果的机器学习过程。追要包括分类和回归。无监督学习:提供数据但是不提供数据对应结果的机器学习过程。主要应用在统计学中的密度估计和聚类分析。Q:K-means的聚类过程A:step1:首先选择k个类别的中心点step2:对任意一个样本,求其到各类中心的距离,将该样本归到距离最短的中心所在的类step3:聚好类后,重新计算每个聚类的中心点位置step4:重复2,3步骤迭代,直到k个类中心点的位置不变,或者达到一定的迭代次数原创 2020-09-25 11:15:20 · 662 阅读 · 0 评论 -
有监督学习、无监督学习和半监督学习的区别
一、基本概念1 特征(feature) 数据的特征。举例:书的内容2 标签(label) 数据的标签。举例:书属于的类别...转载 2019-10-24 11:27:39 · 7861 阅读 · 0 评论 -
支持向量机简介
什么是支持向量机——线性分类器给定一些数据点,它们分别属于两个不同的类,现在要找到一个线性分类器把这些数据分成两类。如果用x表示数据点,用y表示类别(y可以取1或者-1,分别代表两个不同的类),一个线性分类器的学习目标便是要在n维的数据空间中找到一个超平面(hyper plane),这个超平面的方程可以表示为( wT中的T代表转置):首先我们看看逻辑回归的内容:Lo...原创 2018-12-25 23:02:07 · 641 阅读 · 0 评论 -
推荐系统Python代码实现
协同过滤推荐系统在我们的日常生活之中无处不在,例如,在电子商城购物,系统会根据用户的记录或者其他的信息来推荐相应的产品给客户,是一种智能的生活方式。之所以交协同过滤,是因为在实现过滤推荐的时候是根据其他人的行为来做预测的,基于相似用户的喜好来实现用户的喜好预测。简要介绍: &n...转载 2019-01-05 00:10:23 · 4931 阅读 · 5 评论 -
推荐系统及协同过滤算法简介
一.推荐系统概述    随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。对于信息的消费者来说, 从大量信息中找到自己感兴趣的信息是一件很困难的事情;对于信息生产者来说,让自己的信息从大量的信息中脱颖而出也是一件很困难的事情。    解决这一问题,代表性的思路有如下三种:1原创 2019-01-05 00:06:19 · 451 阅读 · 0 评论 -
数据预处理:One-Hot Encoding
机器学习中,在对数据进行训练之前,都会对数据进行预处理,也就是特征提取,个人认为特征提取是训练模型中非常非常重要的一步!在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。将离散型特征使用one-hot编码,确实会让特征之间的距离计算更加合理。比如,有一个离散型特征,代表...原创 2018-11-28 10:19:50 · 310 阅读 · 0 评论 -
tensorflow实现线性回归
tensorflow实现线性回归# coding=utf-8# By author MZimport tensorflow as tffrom sklearn.datasets import load_bostonimport numpy as np###警告:Your CPU supports instructions that this TensorFlow binary was...原创 2018-11-27 15:09:11 · 218 阅读 · 0 评论 -
线性回归和逻辑回归区别
线性回归和逻辑回归线性:y=a*x 是一次方的变化回归:回归到平均值线性回归用作回归预测逻辑回归用作二分类,也可以做多分类从数据上来讲,线性回归的样本的输出,都是连续值,而逻辑回归中y只能取0或者1。...原创 2018-11-27 15:02:51 · 889 阅读 · 0 评论