MapReduce----线性最小二乘(线性回归)

本博客深入探讨了解线性最小二乘问题的准备工作及其实现方式,并阐述如何利用MapReduce技术优化矩阵运算,以解决主成分分析中的大规模数据集处理问题。通过将数据集划分并分配到多个计算节点,实现高效的数据并行处理,最终得到优化后的结果。

要理解本章,要先看懂线性最小二乘这篇文章。

我们知道在解线性最小二乘问题时,我们已知的准备工作是数据集(训练集),包含M个点,即:

其中:

而我们最后要的结果是

我们是通过下面的式子求的:

其中:

我们求时,就会用到MapReduce

因为都是矩阵相乘的结果,那么根据MapReduce---<数学之美>这篇文章,可知道通过矩阵的分块来实现MapReduce的两个过程。

其中:

(注意:向量只不过是在向量前加上了标量1)

我们把这M个分成份,分别再台计算机上运行,那么这个过程就是Map

然后把个结果相加,就得到了矩阵,这个过程就是Reduce

—————————————————————————————————————————————————————————————————————————————

结论:如果算法过程中出现矩阵的相乘,那么这一步我们就可以用MapReduce

下一节,讨论主成分分析在什么地方,用到MapReduce,最好先看一下主成分分析的证明过程,哪一个地方,用到了矩阵的相乘。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值