Keras入门笔记(番一)：从源码分析K.batch_dot及与dot的区别

最新推荐文章于 2022-11-11 16:29:34 发布

身披白袍

最新推荐文章于 2022-11-11 16:29:34 发布

阅读量4.6k

点赞数 5

分类专栏：机器学习|数据挖掘|数学模型文章标签： keras magic

本文链接：https://blog.youkuaiyun.com/Shenpibaipao/article/details/103063911

版权

这篇博客探讨了Keras中`batch_dot`函数与`dot`的区别，强调了`batch_dot`在处理批样本维度时的优化。文章通过源码分析解释了`batch_dot`并非真正的点积，而是一种自定义维度的逐元素乘法，特别适合深度学习场景中的特定计算。此外，博客还讨论了不同维度向量和矩阵的乘法规则及其在各种计算环境中的不同命名。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

动机

矩阵和向量的乘法各种名称都有，甚至相互混杂，在不同框架里的命名也不一样，每每都会陷入这些Magic中。例如，同样是dot对向量shape= (n,)和一维张量shape=(n,1)而言都不一样，无论总结过多少次，像我们这种torch和tensowflow、matlab轮着写的人，总是不经意间就会翻车。

好在keras提供了高级的接口，至少在tensorflow、theano以及可能会有的mxnet上的表现是一致的。

各种向量乘法的命名

我个人非常烦什么“点积、外积、内积、点乘、叉乘、直积、向量积、张量积”的说法，乱的不行。我觉得，还是应该统一一下，别一会儿点积一会儿点乘，二维一维都不区分，非常容易乱。由于中文教材各种翻译都有，因此主要还是用wiki作为统一吧。

一维(向量)

需要注意的是，shape=(n, )的才是一维向量，shape(n,1)已经变成张量了。

Dot product

import numpy as np
a = np.array([1,2,3,4,5])  # 向量，不区分列向量或行向量。应该视为列向量。
b = a.reshape((5,1))  # 张量
print(a.shape, b.shape, a.T.shape)  # (5,) (5, 1) (5,)
print((a+b).shape)  # (5, 5)
print(np.dot(a,a), a*a)  # 55 [1 4 9 16 25]
print(np.dot(b.T,b))  # [[55]]
# Also, a*a = np.multiply(a, a), b*b = np.multiply(b, b)