Tensorflow基础:tf.matmul() 和tf.multiply() 的区别

本文介绍了TensorFlow中两个矩阵乘法相关函数。tf.multiply()实现元素级相乘,要求两数数据类型相同;tf.matmul()用于矩阵乘法,输入需为矩阵或高秩张量,转置后尺寸要匹配,且两矩阵类型需一致,还说明了可能引发的错误。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. tf.multiply() 两个矩阵中对应元素各自相乘

格式:

tf.multiply(x, y, name=None)

参数:
x: 一个类型为:half, float32, float64, uint8, int8, uint16, int16, int32, int64, complex64, complex128的张量。

y: 一个类型跟张量x相同的张量。

返回值: x * y element-wise.

注意:
(1)multiply这个函数实现的是元素级别的相乘,也就是两个相乘的数元素各自相乘,而不是矩阵乘法,注意和tf.matmul区别。

(2)两个相乘的数必须有相同的数据类型,不然就会报错。

  1. tf.matmul()
    将矩阵a乘以矩阵b,生成a * b。

格式:

tf.matmul(a, b, transpose_a=False, transpose_b=False, adjoint_a=False, adjoint_b=False, a_is_sparse=False, b_is_sparse=False, name=None) 

参数:

a: 一个类型为 float16, float32, float64, int32, complex64, complex128 且张量秩 > 1 的张量。

b: 一个类型跟张量a相同的张量。

transpose_a: 如果为真, a则在进行乘法计算前进行转置。

transpose_b: 如果为真, b则在进行乘法计算前进行转置。

adjoint_a: 如果为真, a则在进行乘法计算前进行共轭和转置。

adjoint_b: 如果为真, b则在进行乘法计算前进行共轭和转置。

a_is_sparse: 如果为真, a会被处理为稀疏矩阵。

b_is_sparse: 如果为真, b会被处理为稀疏矩阵。

name: 操作的名字(可选参数)

返回值: 一个跟张量a和张量b类型一样的张量且最内部矩阵是a和b中的相应矩阵的乘积。

注意:

(1)输入必须是矩阵(或者是张量秩 >2的张量,表示成批的矩阵),并且其在转置之后有相匹配的矩阵尺寸。

(2)两个矩阵必须都是同样的类型,支持的类型如下:float16, float32, float64, int32, complex64, complex128。
引发错误:
ValueError: 如果transpose_a 和 adjoint_a, 或 transpose_b 和 adjoint_b 都被设置为真

将上述代码改写成 TensorFlow 2.x 版本的代码如下: ```python import tensorflow as tf def weight(shape, stddev, wd): initial = tf.random.truncated_normal(shape, stddev=stddev) var = tf.Variable(initial) if wd is not None: weight_decay = tf.multiply(tf.nn.l2_loss(var), wd, name='weight_loss') tf.add_to_collection('losses', weight_decay) return var class MyModel(tf.keras.Model): def __init__(self, in_nodes=784, h1_nodes=100, h2_nodes=100, h3_nodes=50): super(MyModel, self).__init__() self.w1 = weight([in_nodes, h1_nodes], 0.1, 0.005) self.b1 = tf.Variable(tf.zeros([h1_nodes])) self.w2 = weight([h1_nodes, h2_nodes], 0.1, 0.0) self.b2 = tf.Variable(tf.zeros([h2_nodes])) self.w3 = weight([h2_nodes, h3_nodes], 0.1, 0.0) self.b3 = tf.Variable(tf.zeros([h3_nodes])) self.w4 = weight([h3_nodes, 10], 0.1, 0.0) self.b4 = tf.Variable(tf.zeros([10])) def call(self, inputs, prob): x = inputs y_ = tf.cast(inputs, tf.float32) h1 = tf.nn.relu(tf.matmul(x, self.w1) + self.b1) h2 = tf.nn.relu(tf.matmul(h1, self.w2) + self.b2) h2_drop = tf.nn.dropout(h2, rate=prob) h3 = tf.nn.relu(tf.matmul(h2_drop, self.w3) + self.b3) h3_drop = tf.nn.dropout(h3, rate=prob) y = tf.nn.softmax(tf.matmul(h3_drop, self.w4) + self.b4) return y model = MyModel() x = tf.keras.Input(shape=(None, 784)) prob = tf.keras.Input(shape=()) y = model(x, prob) y_ = tf.keras.Input(shape=(None, 10)) # 定义损失函数 cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.math.log(y), reduction_indices=[1])) tf.add_to_collection('losses', cross_entropy) loss = tf.add_n(tf.get_collection('losses')) # 定义优化器 train_step = tf.train.AdamOptimizer(1e-4).minimize(loss) # 训练模型 with tf.Session() as sess: sess.run(tf.global_variables_initializer()) for i in range(1000): batch_xs, batch_ys = mnist.train.next_batch(100) sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys, prob: 0.5}) ``` 在 TensorFlow 2.x 中,可以使用 `tf.reduce_mean` `tf.reduce_sum` 函数来计算张量的平均值;使用 `tf.math.log` 函数来计算张量的自然对数。此外,可以使用 `tf.train.AdamOptimizer` 来定义优化器,使用 `model.trainable_variables` 来获取所有可训练的变量。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值