tf.matmul() 和tf.multiply() 的区别以及怎么理解三维数组的shape含义

最新推荐文章于 2024-04-28 18:05:44 发布

工藤旧一

最新推荐文章于 2024-04-28 18:05:44 发布

阅读量1.9k

点赞数 5

CC 4.0 BY-SA版权

分类专栏： # pd、np、tf等语法

本文链接：https://blog.youkuaiyun.com/weixin_45459911/article/details/105799640

pd、np、tf等语法专栏收录该内容

14 篇文章

订阅专栏

本文详细解析了TensorFlow中tf.matmul()与tf.multiply()的区别及使用场景，通过具体代码示例展示了矩阵乘法与元素级乘法的实现，并解释了三维数组shape的理解方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

tf.matmul（）是常见的矩阵相乘运算，而tf.multiply（）则是两个矩阵中对应元素的相乘运算。

具体用法：

multiply 等同与* ，用于计算矩阵之间的element-wise 乘法，要求矩阵的形状必须一致(或者是其中一个维度为1)，否则会报错.
matmul 是tensor的矩阵乘法, 参与运算的两个tensor维度、数据类型必须一致，
参与运算的是最后两维形成的矩阵，如果tensor是二维矩阵，则等同于矩阵乘法.

代码示例

import tensorflow as tf
a = tf.constant([1, 2, 3, 4, 5, 6, 7, 8, 9, 10,11,12], shape=[2, 3, 2])
b = tf.constant([1, 2, 3, 4, 5, 6], shape=[2, 3, 1])
c = a*b 
with tf.Session():
    print(a.eval())
    print(b.eval())
    print(c.eval())

输出为：

>> a
[[[ 1  2]
  [ 3  4]
  [ 5  6]]
 
 [[ 7  8]
  [ 9 10]
  [11 12]]]
>>b
[[[1]
  [2]
  [3]]
 
 [[4]
  [5]
  [6]]]
>>c
[[[ 1  2]
  [ 6  8]
  [15 18]]
 
 [[28 32]
  [45 50]
  [66 72]]]