- 博客(13)
- 收藏
- 关注

原创 GCN算法及实例分析
一.GCN前瞻知识1.图卷积计算公式:H(l+1)=σ(D~−12A~D~−12H(l)W(l))\mathrm{H}^{(l+1)}=σ(\widetilde{D}^{-\frac{1}{2}}\widetilde{A}\widetilde{D}^{-\frac{1}{2}}H^{(l)}W^{(l)})H(l+1)=σ(D−21AD−21H(l)W(l))A~=A+I\widetilde{A}=A+IA=A+ID~=∑jA~ij\widetilde{D}=\sum_j\widetilde{A}
2020-09-26 23:48:52
7606
5
转载 快速排序(分治思想)(C++)
算法思想第一步:确定分界点分界点可以是任意一点,合理即可第二步:调整区间假设分界点为x,将区间调整为>x和<=x两部分第三步:递归处理左右两段注:对于步骤二,可以暴力解决,也可以通过指针的方法提高效率main函数int main(void) { int n; scanf("%d", &n); if (n <= 0) { puts(""); } vector<int> vec(n); for (int i = 0; i &l
2022-01-03 16:30:41
183
原创 Policy Gradient
简介强化学习是一个通过奖惩来学习正确行为的机制。 家族中有很多种不一样的成员,有学习奖惩值,根据自己认为的高价值选行为, 比如 Q learning, Deep Q Network, 也有不通过分析奖励值,直接输出行为的方法,这就是今天要说的 Policy Gradient 了。甚至我们可以为 Policy Gradients 加上一个神经网络来输出预测的动作。对比起以值为基础的方法,Policy Gradients 直接输出动作的最大好处就是,它能在一个连续区间内挑选动作,而基于值的,比如 Q-lear
2021-06-30 18:08:28
516
原创 基于深度强化学习的长期推荐系统
A deep reinforcement learning based long-term recommender system基于深度强化学习的长期推荐系统ABSTRACT推荐系统旨在最大化长期推荐的整体准确性。然而,现有的推荐模型大多采用静态视图,忽略了推荐是一个动态的顺序决策过程。结果,他们无法适应新的情况,并遭受冷启动问题。虽然顺序推荐方法最近已经得到了关注,但是长期推荐的目标仍然没有被明确地解决,因为这些方法是为短期预测情况开发的。为了克服这些问题,我们提出了一种新的基于深度强化学习的top
2021-04-14 11:43:39
2232
1
原创 矩阵分解及案列分析
一.概述1.推荐算法(recommendation algorithm):推荐算法是计算机专业中的一种算法,通过一些数学算法,推测出用户可能喜欢的东西,目前应用推荐算法比较好的地方主要是网络,其中淘宝做的比较好。所谓推荐算法就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。详情参考:https://baike.so.com/doc/962578-1017418.html2.实例:在推荐系统中,最重要的数据是用户对商品的打分数据,数据形式如下所示:其中,U1⋯U5表示的是55个
2020-07-27 19:39:36
1070
原创 KNN算法及案列分析
1.KNN算法概述用官方的话来说,所谓K近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。2.KNN算法原理如果K=3,绿色圆点的最近的3个邻居是2个红色小三角形和1个蓝色小正方形,少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于红色的三角形一类。如果K=5,绿色圆点的最近的5个邻居是2个红色三角形和3个蓝色的正方形,还是少数从属于多数,基于统计的方法,判定
2020-07-19 23:45:36
2640
原创 梯度下降预测房价
梯度下降预测房价题目:房屋价格与面积(数据在下面表格中)序号面积价格11506450220074503250845043009450535011450640015450760018450使用梯度下降求解线性回归(求0,1)要求:(1)对关键代码进行注释;(2)把每次迭代计算出来的theta0 ,theta1 画出来;(3)分别用随机梯度和批量梯度实现,并在同一个图形中进行对比(颜色不同)。python
2020-07-12 18:53:21
2179
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人