TensorFlow batch_dot函数理解

最新推荐文章于 2023-12-22 11:51:16 发布

linuxwindowsios

最新推荐文章于 2023-12-22 11:51:16 发布

阅读量3.9k

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签：深度学习 TensorFlow

本文链接：https://blog.youkuaiyun.com/linuxwindowsios/article/details/84189907

深度学习专栏收录该内容

4 篇文章

订阅专栏

本文详细介绍了在TensorFlow框架下使用Keras的batch_dot函数进行矩阵运算的方法。通过实例演示了不同axes参数设置下batch_dot的计算过程，并与tf.reduce_sum和tf.multiply结合使用验证结果的一致性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

batch_dot实现

载入库

import tensorflow as tf
tf.enable_eager_execution()
import keras.backend as K
import numpy as np

生成输入数据

x1 = tf.convert_to_tensor([[1,2,3],[4,5,6]])
x2 = tf.convert_to_tensor([[1,2,3],[4,5,6]])

K.batch_dot(x1,x2,axes=1).numpy()

axes为1 的batch_dot输出如下：

array([[14],
       [77]], dtype=int32)

axes为2的batch_dot输出如下：

K.batch_dot(x1,x2,axes=0).numpy()

array([[17],
       [29],
       [45]], dtype=int32)

实际上与先经过位对位乘法然后按某一个轴作聚合加法返回的结果一直，下面是验证结果。

tf.reduce_sum(tf.multiply(x1 , x2) , axis=0).numpy()

array([17, 29, 45], dtype=int32)

tf.reduce_sum(tf.multiply(x1 , x2) , axis=1).numpy()

array([14, 77], dtype=int32)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

linuxwindowsios

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

pytorch和tensorflow函数对应表

08-09

1330

pytorch和tensorflow函数对应关系

Keras API:keras.backend.batch_dot

u010404548的博客

02-02

636

#!/usr/bin/python3 # -*- coding:utf-8 -*- """ @Author : heyw @Contact : he_yuanwen@126.com @Time : 2020/2/2 12:51 @Software: PyCharm @FileName: K.batch_dot.py """ import tensorflow as tf import ...

参与评论您还未登录，请先登录后发表或查看评论

浅谈keras中的batch_dot,dot方法和TensorFlow的matmul

12-17

概述在使用keras中的keras.backend.batch_dot和tf.matmul实现功能其实是一样的智能矩阵乘法，比如A,B,C,D,E,F,G,H，I,J,K,L都是二维矩阵，中间点表示矩阵乘法，AG 表示矩阵A 和G 矩阵乘法（A 的列维度等于G 行维度），WX=Z import keras.backend as K import tensorflow as tf import numpy as np w = K.variable(np.random.randint(10,size=(10,12,4,5))) k = K.variable(np.random.randint(

对于Tensorflow中dot（）的运用以及对batch_dot()的理解

up_XCY的博客

11-04

3545

#dot dot(x,y) #求两个张量的乘积。当试图计算两个N阶张量的乘积时，与Theano行为相同 #如：（2,3）.（4,3,5） = （2,4,5） x = K.placeholder(shape=(2,3)) y = K.placeholder(shape=(3,4)) xy = K.dot(x,y) xy #输出为：<tf.Tensor 'MatMul_9:0' shape=...

tf2.0 中multiply、matmul、dot、batch_dot注意区别

sjyttkl的专栏

06-13

849

https://zhuanlan.zhihu.com/p/369454127

理解keras中的batch_dot，dot方法和TensorFlow的matmul

huml126的专栏

03-22

1万+

理解keras中的K.batch_dot和TensorFlow的tf.matmul 概述在使用keras中的keras.backend.batch_dot和tf.matmul实现功能其实是一样的智能矩阵乘法，比如A,B,C,D,E,F,G,H，I,J,K,LA,B,C,D,E,F,G,H，I, J,K,LA,B,C,D,E,F,G,H，I,J,K,L都是二维矩阵，中间点表示矩阵乘法，AGAGAG...

Keras K.batch_dot解释

得克特

07-09

3536

K.batch_dot tf keras 的点乘是不同的，转换使用的时候不熟练就混用了…K.batch_dot是一个Batchwise dot，使用的范围就是两个data in batches，通常的shape (batch_size,:) 函数定义 batch_dot(x, y, axes=None) 注意：batch_size 是不参与矩阵运算的，如果除了batch这个维度，只有一个维度，则会自动补一个维度 axes指定两个数据矩阵相乘的维度，axes里提供的两个data的维度对应的数值是相同的，这也是

Keras入门笔记(番一)：从源码分析K.batch_dot及与dot的区别

身披白袍的博客

11-14

4699

动机矩阵和向量的乘法各种名称都有，甚至相互混杂，在不同框架里的命名也不一样，每每都会陷入这些Magic中。例如，同样是dot对向量shape= (n,)和一维张量shape=(n,1)而言都不一样，无论总结过多少次，像我们这种torch和tensowflow、matlab轮着写的人，总是不经意间就会翻车。好在keras提供了高级的接口，至少在tensorflow、theano以及可能会有的mx...

Transformer实践中K.batch_dot报错问题及解决方案

weixin_48384960的博客

09-29

490

Transformer实践中K.batch_dot报错问题及解决方案在采用Transformer机制进行中文文本分类时，采用了github大神基于tensorflow2.0和内置keras的代码代码地址但在实际应用中，attention的call函数使用内置keras.backend的batch_dot函数会出现维度溢出的现象，两个四阶张量计算结果为五阶张量，导致后续程序报错。 def call(self, x): #如果只传入Q_seq,K_seq,V_seq，那么就不做Ma

K.batch_dot()的用法总结

weixin_42038795的博客

05-19

3465

K.batch_dot()的用法总结 K.batch_dot(a, b, axis) 输入1：a(计算量1，维度应该大于等于2) 输入2：b(计算量2，维度应该大于等于2) 输入3：axis(可以是一个元组(x,y)，也可以是一个整数) 当axis是一个元组(x,y)时，x代表a参与计算的维数，y代表b参与计算的维度；当axis是一个整数z时，则a和b参与计算的维数均为z；当axis为none时，则a参与计算的维数是倒数第一维，b参与计算的维数是倒数第二维(听说有的情况是b也是倒数第一维，比较少遇到)。

Keras中K.batch_dot()解释

weixin_43325818的博客

06-29

908

博主在学习Keras入门教程时，发现batch_dot()这个函数不好理解，在结合官方文档和其他博客以及博主自己的理解，整理如下：（注意：分了三个Case例子进行讲解，且理解从浅到深层依次递进。） ———————————————————————————————————————— Case1：x的shape为（128,1,2）, y的shape为（128,2,768）.则K.batch_dot(x, y)的结果shape为（128,1,768）浅层理解：把batch即上式的128忽略掉，剩余的维度即（1,2

keras.backend

weixin_36670529的博客

05-26

4565

Keras backend API. 一、Functions abs(...): Element-wise absolute value. all(...): Bitwise reduction (logical AND). any(...): Bitwise reduction (logical OR). arange(...): Creates a 1D tensor contain...

使用keras.backend.batch_dot获取的shape不匹配问题

u014742995的博客

01-18

404

import keras.backend as K import numpy as np w = K.variable(np.random.randint(10,size=(64, 128, 4, 8))) k = K.variable(np.random.randint(10,size=(64, 128, 8, 16))) z = K.batch_dot(w,k) print(z.shape) #(64, 128, 4, 16) 使用K.batch_dot(qw, kw)时，我们想要z的shape.

代码系列——keras.layers.Dot()解析

lynlindasy的博客

09-06

1万+

Dot类在keras的Merge中，根据Keras中文文档：https://keras-cn.readthedocs.io/en/latest/layers/merge/， Merge层提供了一系列用于融合两个层或张量的层对象或方法，以大写首字母开头的是Layer类，以小写字母开头的是张量的函数，张量函数内部其实调用了大写字母开头的层。Dot类源代码如下： https://github.com...

总是傻傻分不清，是时候总结一下numpy，tensorflow，keras的乘除法了

golfbears的博客

11-16

1497

乘除法好理解，但是一维向量，二维矩阵，三维+张量的乘除法就不一定能招架了，为了以后碰到类似问题不抓狂，本文总结罗列一下numpy，tensorflow，keras几种工具对各种乘除法的定义和api。

Tensorflow 学习与复习 Epoch_1 # tensorflow的一些函数方法

weixin_38282236的博客

10-19

1716

1：一个例子 import tensorflow as tf import numpy as np # 随机生成数据，100个点，x，y x_data = np.float32(np.random.rand(2, 100)) #np.random.rand(d0,d1,...,dn) 随机生成n维矩阵 y_data = np.dot([0.100,

keras Lambda自定义层实现数据的切片,Lambda传参数

最新发布

03-04

### TensorFlow 中自注意力机制的实现在TensorFlow中，自注意力机制(self-attention)能够帮助模型聚焦于输入序列的不同部分，从而增强对特定位置的关注程度。这种机制特别适用于自然语言处理(NLP)，但也广泛应用于计算机视觉领域。 #### 实现细节自注意力机制的核心在于计算查询(query)、键(key)以及值(value)三者间的交互关系[^1]。具体而言： - 查询、键和值都是由同一组输入数据变换而来； - 计算过程中会先通过线性投影(linear projection)分别得到这三个矩阵； - 接着利用softmax函数计算出注意力分数(attention scores)，这一步骤决定了哪些部分应该被赋予更高的权重； - 最终加权求和获得输出表示。下面是使用TensorFlow实现简单版多头自注意力(Multi-head Self Attention, MSA)的例子: ```python import tensorflow as tf from tensorflow.keras.layers import Dense, LayerNormalization, Dropout class MultiHeadAttention(tf.keras.Model): def __init__(self, d_model, num_heads): super().__init__() self.num_heads = num_heads self.d_model = d_model assert d_model % self.num_heads == 0 self.depth = d_model // self.num_heads self.wq = Dense(d_model) self.wk = Dense(d_model) self.wv = Dense(d_model) self.dense = Dense(d_model) def split_heads(self, x, batch_size): """Split the last dimension into (num_heads, depth).""" x = tf.reshape(x, (batch_size, -1, self.num_heads, self.depth)) return tf.transpose(x, perm=[0, 2, 1, 3]) def call(self, v, k, q, mask=None): batch_size = tf.shape(q)[0] q = self.wq(q) k = self.wk(k) v = self.wv(v) q = self.split_heads(q, batch_size) k = self.split_heads(k, batch_size) v = self.split_heads(v, batch_size) scaled_attention, attention_weights = scaled_dot_product_attention( q, k, v, mask) scaled_attention = tf.transpose(scaled_attention, perm=[0, 2, 1, 3]) concat_attention = tf.reshape(scaled_attention, (batch_size, -1, self.d_model)) output = self.dense(concat_attention) return output, attention_weights def scaled_dot_product_attention(q, k, v, mask=None): matmul_qk = tf.matmul(q, k, transpose_b=True) dk = tf.cast(tf.shape(k)[-1], tf.float32) logits = matmul_qk / tf.math.sqrt(dk) if mask is not None: logits += (mask * -1e9) attention_weights = tf.nn.softmax(logits, axis=-1) output = tf.matmul(attention_weights, v) return output, attention_weights ``` 此代码片段展示了如何定义一个多头自注意层，并提供了`scaled_dot_product_attention`辅助函数用于执行缩放点积操作。 #### 应用场景自注意力机制已经被证明可以在多个方面提升性能，尤其是在涉及长期依赖性的任务上表现优异。例如，在机器翻译、文本摘要生成等领域有着广泛应用；而在图像识别任务中，则可通过引入空间维度上的自注意力来捕捉更加丰富的局部模式[^2]。此外，当面对具有复杂内部结构的数据集时，如文档级别的分类问题或是视频分析等场合下，分层(hierarchical)或多尺度(multi-scale)版本的自注意力架构同样显示出巨大潜力[^4]。