《机器学习技法》第15课笔记 矩阵分解

本文介绍了如何使用线性神经网络预测用户对电影的评分。通过矩阵分解的方式将用户评分矩阵分解为用户特征矩阵和电影特征矩阵,实现了评分预测。文章还讨论了优化问题的解决方法,包括交替最小二乘法和随机梯度下降法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

课程来源:林轩田《机器学习技法》

课程地址:https://www.bilibili.com/video/av12469267/?p=1


1. x是用户特征,y是用户对电影的评分,可以用这样的两层网络来训练

2. 考虑到X是onehot过的,只有一个x是1,其它都是0,所以不需要再进行激活了,没有阈值要考虑,直接输入就输出,那么可以线性神经元。这时就称为线性神经网络


3. 估算的用户评分,就是先经过第一层转换V,然后第二层转换W。针对某个具体的电影,那么只要W第m列的值就行了

4. W是电影矩阵,V是用户转换矩阵,我们要做的就是预测值矩阵y和真实的用户评分矩阵r尽可能接近。定义损失函数

5. 我们一旦解出了该优化问题,那么就可以做到两件事
1)怎么做转换(V)
1)第二层的权重是多少(W)

6. 我们要做的就是把R拆成V*W
1)V可以认为学习了用户感兴趣的元素
2)W可以认为学习了电影包含的元素

7. 矩阵学习问题
1)因为有两个优化对象,可以考虑像kmeans那样,固定一个,然后优化另一个;固定另一个,然后优化一个
2)这种方法要被称为交替的最小二乘
3)具体过程

8. 矩阵分解与线性自动编码机

9. 原因是每次更新一行和一列

10. 使用SGD解矩阵分解(更常用)

在大规模矩阵中非常有效率。

11. 比赛中数据是有时间的,越新的数据对预测的影响越大,那么怎么把这个信息引入?
SGD最后搜寻的是数百个点,这数百个点对模型最后的效果影响很大。那么不用随机梯度下降了,而是越往后遇到越新的点的概率更高。

12. extraction model:
1)抽取特征
2)赋予权重

13. extraction model的优缺点:
1)优点:
a. 自动抽取特征
b. 能抽取足够强的特征
2)缺点:
a. 是非凸的最优化问题,容易陷入局部最优解
b. 容易过拟合

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值