- 博客(24)
- 收藏
- 关注
原创 安装pointnet2-ops库
由于服务器没有连网,现在已在github中下载pointnet2_ops文件包并上传到服务器。(首先保证cuda版本和pytorch版本对应)然后执行安装命令即可。
2025-02-28 21:33:48
365
原创 【Wide&Deep模型】记忆能⼒和泛化能⼒的综合
Wide&Deep模型是由单层的 Wide部分和多层的 Deep部分组成的混合模型。其中,Wide部分的主要作⽤是让模型具有较强的“记忆能⼒”;Deep部分的主要作⽤是让模型具有“泛化能⼒”,正是这样的结构特点,使模型兼具了逻辑回归和深度神经⽹络的 优点——能够快速处理并记忆⼤量历史⾏为特征,并且具有强⼤的表 达能⼒。“记忆能⼒”可以被理解为模型直接学习并利⽤历史数据中物品或 者特征的“共现频率”的能⼒。⼀般来说,协同过滤、逻辑回归等简单 模型有较强的“记忆能⼒”。
2024-05-05 21:13:19
362
原创 【GBDT+LR】—特征⼯程模型化的开端
FFM模型采⽤引⼊特征域的⽅式增强了模型的特征交叉能⼒,但 ⽆论如何,FFM只能做⼆阶的特征交叉,如果继续提⾼特征交叉的维 度,会不可避免地产⽣组合爆炸和计算复杂度过⾼的问题。
2024-05-05 20:09:41
369
原创 因式分解机家族
逻辑回归模型表达能⼒不强的问题,会不可避免地造成有效信息 的损失。在仅利⽤单⼀特征⽽⾮交叉特征进⾏判断的情况下,有时不 仅是信息损失的问题,甚⾄会得出错误的结论。
2024-05-05 19:54:32
439
原创 逻辑回归模型在推荐系统中的应用
逻辑回归模型的推断过程可以分为如下⼏步:(1)将特征向量x=(x1,x2,…,xn)作为模型的输⼊。(2)通过为各特征赋予相应的权重(w1,w2,…,wn+1),来表 ⽰各特征的重要性差异,将各特征进⾏加权求和,得到x Tw。(3)将xTw输⼊ sigmoid 函数,使之映射到 0~1 的区间,得到最 终的“点击率”。综上,逻辑回归模型整个推断过程的数学形式对于标准的逻辑回归模型来说,要确定的参数就是特征向量相应 的权重向量w。梯度下降法是⼀个⼀阶最优化算法,也称为最速下降法。
2024-05-05 18:02:41
874
原创 【协同过滤进化】矩阵分解算法
为解决UserCF和ItemCF协同过滤算法中头部效应明显,处理稀疏向量能力弱的问题,同时增加模型的泛化能⼒,矩阵分解技术被提出。
2024-05-05 16:48:18
794
原创 【协同过滤】UserCF协同过滤方法简介
顾名思义,“协同过滤”就是协同⼤家的反馈、评价和意见⼀起对 海量的信息进⾏过滤,从海量信息中筛选出⽬标⽤户可能感兴趣的信息的推荐过程。图2-2描述了⼀个电商⽹站场景下的协同过滤推荐过程,其推荐过 程按照图2-2(a)~(f)的顺序共分为6步。明确商品库中的数据有哪些:电商⽹站的商品库⾥⼀共有4件商品:游戏机、某⼩说、某 杂志和某品牌电视机。 明确任务:⽤户X访问该电商⽹站,电商⽹站的推荐系统需要决定是否 推荐电视机给⽤户X。换⾔之,推荐系统需要预测⽤户X是否喜欢该品牌的电视机。为了进⾏这项预测
2024-05-05 15:25:26
215
原创 【MIND】基于动态路由的多兴趣网络
每个实例可以由元组表示,其中Iu表示用户u交互的项目集合(也称为用户行为),Pu表示用户u的基本简档(如用户性别和年龄),Fi表示目标项目的特征(如项目id和类别id)。item id 特征嵌入到低维密集向量中,显着减少了参数数量并简化了学习过程。user id、性别、年龄等,将相应的嵌入连接起来形成用户画像Pu。类别id、品牌id等相应的嵌入进一步通过平均池化层以形成对应的embeding。MIND的核心任务是学习一个函数,用于将原始特征映射到用户表示中,可以用公式表示为。
2024-05-05 01:31:25
800
原创 【推荐系统的评估】离线评估指标AUC
ROC曲线的横坐标为False Positive Rate(FPR,假阳性率),所有负样本中被错判为正的样本数所占的比例,显然,我们不希望该指标太高。纵坐标为True Positive Rate(TPR,真阳性率),所有正样本中真正为正样本的样本所占比例,当然,我们希望真阳率越高越好。。
2024-05-04 23:11:58
1378
原创 【推荐系统的评估】离线评估的方法
离线评估的基本原理是在离线环境中,将数据集分为“训练 集”和“测试集”两部分,⽤“训练集”训练模型,⽤“测试集”评估模型。根据的不同,离线评估可分为以下3种。
2024-05-04 18:56:36
538
原创 【DSIN】深度 Session 兴趣网络
所以,DSIN就是从序列本身的特点出发,把一个用户的行为序列分成了多个会话,所谓会话,其实就是按照时间间隔把序列分段,每一段的商品列表就是一个会话,那这时候,会话里面每个商品之间的相似度就比较大了,而会话与会话之间商品相似度就可能比较小。图片下方的数字表示单击当前项目的时间与单击第一个项目的时间之间的时间间隔(以秒为单位),我们将她的行为序列分为3个会话。每次会话的时间间隔超过30分钟时,会话将按照这一原则进行划分。用户在会话1中主要浏览裤子,在会话2中主要浏览戒指,并且在会话3中主要浏览外套。
2024-05-04 18:32:11
864
原创 【行为序列建模发展路线梳理】
按时间线来看,用户行为序列建模的模型经历了polling, attention, RNN, Capsule,Transformer的发展路线。
2024-05-04 16:30:14
970
原创 【BST】Behavior Sequence Transformer for E-commerceRecommendation in Alibaba
传统的Embedding&MLP模型结构将原始特征嵌入到低维向量中,然后将其concat后输入MLP进行最终推荐。DIN提出使用注意力机制来捕获候选项与用户先前点击的项之间的相似性。然而,大多数这些工作,即用户点击的项目的顺序。实际上,顺序对于预测用户未来的点击很重要。例如,用户在淘宝上买了一部iPhone后,往往会点击手机壳,或者在买了一条裤子后,试图找到一双合适的鞋子。从这个意义上说,在淘宝排名阶段部署预测模型时,如果不考虑这一因素,就会出现问题。
2024-05-03 22:34:34
549
原创 【DIEN】深度兴趣进化网络的点击率预测
所有T个兴趣点[h1,h2,· · ·,hT]的连接组成了兴趣演化层可以对其进行兴趣演化建模的兴趣序列。其中ea是来自范畴ad的域的嵌入向量,W ∈ RnH×nA,nH是隐藏状态的维数,nA是广告的嵌入向量的维数。对于行为特征bt,如果bt[jt] = 1,则其对应的嵌入向量是mjt,并且一个用户的行为的有序嵌入向量列表可以由eb = [mj 1;T是历史行为的个数,nE是嵌入维数,ei b [t] ∈ G表示用户i点击的第t个项目的嵌入向量,G是整个项目集。首先,将来自一个类别的嵌入向量送入池化操作。
2024-05-03 18:06:21
1030
原创 使用Ananconda 创建环境时出现:UnavailableInvalidChannel: HTTP 404 NOT FOUND for channel simple
创建环境后,下载某些包时报如下错误:conda install timmRetrieving notices: ...working... doneChannels: - conda-forge - anaconda.org - defaultsPlatform: linux-64Collecting package metadata (repodata.json): failedUnavailableInvalidChannel: HTTP 404 NOT FOUND for ch
2024-03-04 15:05:27
2627
2
原创 【三维点云笔记】点云数据增强中随机dropping color的作用、流程、代码实现
在点云数据增强中,随机dropping color是一种常用的数据操作过程,它的目的是改变点云数据的颜色分布,从而增加模型的鲁棒性和泛化性能。具体来说,该过程会将点云中的一部分颜色信息随机设置为全零,也就是将其去除。
2024-02-26 14:42:54
486
1
转载 「详解」torch.nn.Fold和torch.nn.Unfold操作
torch.nn.Unfold按照官方的说法,既从一个batch的样本中,提取出滑动的局部区域块,也就是卷积操作中的提取kernel filter对应的滑动窗口。由上可知,torch.nn.Unfold的参数跟nn.Conv2d的参数很相似,即,kernel_size(卷积核的尺寸),dilation(空洞大小),padding(填充大小)和stride(步长)
2024-01-19 15:52:43
1632
1
原创 Wasserstein距离
问题描述清楚了:就是把P中的m个坑的土,用最小的代价搬到Q中的n个坑中,pi到qj的两个坑的距离由dij来表示。为了让P2和Q2相同,我们也要做类似的挖土填土工作,但注意,此时P2手头上由P1填的2,因此现在P2是4,但是Q2依然是2,因而P2也要挖2分土给P3,保持和Q2一样。假设有两个工地P和Q,P工地上有m堆土,Q工地上有n个坑,现在要将P工地上的m堆土全部移动到Q工地上的n个坑中,所做的最小的功。每堆土我们用一个二元组来表示(p,w),p表示土堆的中心,w表示土的数量。Wasserstein距离。
2023-12-22 17:44:15
580
原创 【Error】无法解析导入“tensorflow.compat.v1”
虽然可以通过查资料将TensorFlow1中使用的函数和模块在TensorFlow2中找到,但改动太大,且有些对应函数参数甚至相反。:想运行使用TensorFlow1写的代码,但环境是TensorFlow2,不想卸载重装。TensorFlow2中可使用此方法使用tensorflow1。如果遇到import无法解析则是使用方法二。
2023-12-21 17:45:36
1712
2
原创 【Error】ImportError: /lib/x86_64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.29‘ not found
在 wsl ubuntu20.04 运行 yolov8 时,出现以下错误。出现的版本比较多,任意选择其中一个版本,使用命令查看是否存在需要的版本。到这一步就已经完成了,可以查看是否已经存在。查看系统下同类型文件,存在的高版本文件。首先输入以下指令查看,当前有哪些版本。可以看到存在我们所需要的文件版本。接下来将文件拷贝过去,并建立连接。可以看到,确实缺少了。
2023-12-19 15:09:23
536
转载 Tmux教程
关于session,很多人把session成为会话,但我觉得叫任务更适合一些。在普通的终端中,窗口和其中由于session(任务)而启动的进程是连在一起的,关闭窗口,session就结束了,session内部的进程也会终止,不管是否运行完。但是在具体使用中,我们希望当前的session隐藏起来,在终端中做其他事情,但是又不希望session及其进程被关闭。这样就需要用到tmux,对session进行解绑。之后再想继续出来这个session的时候,再次绑定就可以回到之前的工作状态。
2023-12-18 14:44:15
74
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人