BSP编程模型（以NMF为例，试验基于消息传递的模型BSP过程）

最新推荐文章于 2025-06-17 16:37:29 发布

原创

最新推荐文章于 2025-06-17 16:37:29 发布 · 4.8k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#梯度下降 #矩阵分解 #最优化 #BSP #NMF

本文探讨了BSP编程模型在解决需要迭代计算的问题时，如非负矩阵分解（NMF）中的优势。通过将NMF问题转化为图模型，利用批量梯度下降进行最优化求解，详细阐述了如何将顶点、边和消息结合起来进行迭代更新，以逼近原始矩阵。实验中设置步长为0.002，以此展示BSP在处理这类问题的简便性和效率。

对于需要迭代计算的算法，MapReduce显然不可用，迭代n次的IO量太大，而基于消息的传递模型，BSP和MPI的优势就出来了。BSP的编程模型，试验过了，确实容易入门，只要将求解问题（例如，优化问题、图的最短路径问题等等）抽象成图模型（顶点Vertex、边Edge）后，再通过消息Message，来不断迭代求解即可。拿前面有篇文章，NMF的矩阵分解这个优化问题，来实验：

1）NMF的矩阵分解基本思想：用分解后的两个矩阵P、Q乘积，来逼近原始矩阵R，越逼近越好。这里，采用L2正则避免过拟合。

2）选定优化方法，将问题抽象成图模型，采用BSP编程模型求解。这里选用批量梯度下降，将待求解问题抽象成顶点、边，举例如下，设用户数m，item数n，k是分解后的m的维数，ks是原始稀疏矩阵的非空元素的个数。则抽象后的节点个数m+n，边数ks。其中，r_ij的值是存储到图的边上。

3）上面的图模型抽象好后，用批量梯度下降来迭代求解这个最优化问题。例如，求p矩阵中每个元素值如下公式，每次迭代更新时就用下面第二个公式。求解q类似，公式略

最低0.47元/天解锁文章

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。