tf.matrix_band_part(input,num_lower,num_upper,name=None)

最新推荐文章于 2022-05-31 10:52:35 发布

sigma_Tian

最新推荐文章于 2022-05-31 10:52:35 发布

阅读量1.1k

点赞数

分类专栏： Python Tensorflow coding

Python 同时被 3 个专栏收录

18 篇文章

订阅专栏

coding

13 篇文章

订阅专栏

Tensorflow

11 篇文章

订阅专栏

本文详细介绍了TensorFlow中tf.matrix_band_part函数的使用方法，包括如何通过设置参数num_lower和num_upper来创建上三角阵、下三角阵和对角阵。通过具体示例展示了如何将矩阵带之外的元素置为0。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

tf.matrix_band_part(input,num_lower,num_upper,name=None)

功能：复制一个矩阵，并将规定带之外的元素置为0。
假设元素坐标为（m，n），则in_band(m, n) = (num_lower < 0 || (m-n) <= num_lower)) &&
(num_upper < 0 || (n-m) <= num_upper)。
band（m,n）=in_band(m,n)*input(m,n)。
特殊情况：

          tf.matrix_band_part(input, 0, -1) ==> 上三角阵.
          tf.matrix_band_part(input, -1, 0) ==> 下三角阵.
          tf.matrix_band_part(input, 0, 0) ==> 对角阵.

输入：num_lower:如果为负，则结果右上空三角阵;
num_lower:如果为负，则结果左下为空三角阵。
例：

a=tf.constant([[0,1,2,3],[-1,0,1,2],[-2,-1,0,1],[-3,-2,-1,0]])
z=tf.matrix_band_part(a,1,-1)

z==>[[0 1 2 3]
     [-1 0 1 2]
     [0 -1 0 1]
     [0 0 -1 0]]

作者：华夏意匠
链接：https://www.jianshu.com/p/336772764fef
來源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

sigma_Tian

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

tf第四讲：tf中的循环tf.while_loop，条件tf.cond，比较、数学运算、类型转换

weixin_43178406的博客

08-21

1万+

本文主要介绍了tf第四讲：tf中的循环tf.while_loop，条件tf.cond，比较、数学运算、类型转换，希望能对学习TensorFlow的同学有所帮助。文章目录 1. tensorflow中的比较函数与类型转换 2. tensorflow中的数学运算 2.1 常用数学运算 2.2 更改tensor的shape 2.3 矩阵数学函数 2.4 reduce相关函数 3. tensorflow如何使用条件句:tf.cond 4. tf中如何使用循环

tensorflow 取上（下）三角矩阵 tf.linalg.band_part

zhixiongzhao的博客

10-14

956

提示：tensorflow 可从已有矩阵中取三角矩阵，也可用于生成为1的三角矩阵。

1 条评论您还未登录，请先登录后发表或查看评论

matrix_band_part 和tf.linalg.band_part

u_say2what的博客

12-11

2038

新版本，tf.matrix_band_part挪到了tf.linalg.band_part,它的主要功能是以对角线为中心，取它的副对角线部分，其他部分设置为0，视觉就像是一个band(带)，tf.linalg.band_part主要有三个参数 input:要输入的张量tensor. num_lower:下三角矩阵保留的副对角线数量，从主对角线开始计算，相当于下三角的带宽。取值为负数时，则全部保...

关于 tf.matrix_band_part

anthea_luo的博客

08-27

1696

在看gpt2源码时，有这样一段： def attention_mask(nd, ns, *, dtype): """1's in the lower triangle, counting from the lower right corner. Same as tf.matrix_band_part(tf.ones([nd, ns]), -1, ns-nd), but do...

tensorflow中去上下三角矩阵：matrix_band_part 和tf.linalg.band_part

ACM_hades的博客

03-25

9609

tf.linalg.band_part 新版本：tf.matrix_band_part变成tf.linalg.band_par 函数原型： tf.linalg.band_part( input, num_lower, num_upper, name=None ) 参数：作用：主要功能是以对角线为中心，取它的副对角线部分，其他部分用0填充。 input:输入...

tf计算矩阵维度_TensorFlow矩阵数学函数：tf.matrix_band_part

weixin_39639505的博客

12-30

425

tf.matrix_band_part 函数matrix_band_part(input,num_lower,num_upper,name=None)复制一个张量,将每个最内层矩阵中的所有中心区域外的所有内容设置为零.该 band 部分计算如下：假设 input 有 k 维 [I, J, K, ..., M, N],则输出是具有相同形状的张量：band[i, j, k, ..., m, n] = ...

tf.matrix_band_part 与 torch.tril 使用

qq_40491305的博客

03-03

1210

tf.matrix_band_part 与 torch.tril 使用这两个函数都是用来取矩阵的某一块值的，简单使用如下 tf.matrix_band_part tf.matrix_band_part(m, -1, 0) 表示取矩阵的下左三角，不包括斜对角。同理，tf.matrix_band_part(m, 0, -1)表示取矩阵的右上三角，不包括斜对角。其他操作详细见tf.matrix_band_part，搭配transpose可灵活取值； torch.tril torch.tril.

tf.linalg.band_part（input,num_lower,num_upper）

qq_44487483的博客

03-19

873

tf.linalg.band_part(input,num_lower,num_upper)，此函数的含义：以主对角线为中心，取它的副对角线部分，其他部分用0 填充 input：输入的张量 num_lower：从主对角线开始计算，下三角矩阵保留的副对角线数量，取值为负数时，则全部保留 num_upper：从主对角线开始计算，上三角矩阵保留的副对角线数量，取值为负数时，则全部保留 import tensorflow as tf a=tf.constant( [[ 1, 1, 1, 1],[1, 1,

tensorflow入门：tf.name_scope，tf.variable_scope、变量共享

yeqiustu的博客

04-03

7434

1. tf.name_scope('scope_name')或tf.name_scope(named_scope)主要与tf.Variable搭配使用；当传入字符串时，用以给变量名添加前缀，类似于目录，如case1所示；当传入已存在的name_scope对象时，则其范围内变量的前缀只与当前传入的对象有关，与更上层的name_scope无关，如case2所示。import tensorflow as...

tensorflow去上下三角矩阵：tf.linalg.band_part

行者无疆的博客

08-17

942

学习transformer的掩码机制时遇到了这个函数，因此记录一下。函数定义： tf.linalg.band_part( input, num_lower, num_upper, name=None ) 作用：以对角线为中心，取它的副对角线部分，其他部分用0填充。参数：先解释一下副对角线，即矩阵中除了主对角线以外的其它对角线。 input:输入的张量。 num_lower:下三角矩阵保留的副对角线数量，取值为负数时全部保留，为0时全为0。 num_up

Tensorflow小技巧整理：tf.trainable_variables(), tf.all_variables(), tf.global_variables()的使用

热门推荐

Cerisier的博客

01-17

4万+

在使用tensorflow搭建模型时，需要定义许多变量，例如一个映射层就需要权重与偏置。当网络结果越来越复杂，变量越来越多的时候，就需要一个查看管理变量的函数，在tensorflow中，tf.trainable_variables(), tf.all_variables(),和tf.global_variables()可以来满足查看变量的要求，来简单说一下他们的不同。

tf.linalg.band_part函数

weixin_49346755的博客

05-31

1427

函数原型 tf.linalg.band_part( input, num_lower, num_upper, name=None ) 函数说明 band_part函数主要用于处理方形矩阵的副对角线上的元素。以对角线为中心，对副对角线上的元素进行取舍（是否用0填充）。参数num_lower表示下三角矩阵保留的副对角线的数量，比如num_lower=2表示下三角矩阵从第二条副对角线开始，之后的所有的副对角线的元素全部用0填充。类似的，参数num_upper表示上三角矩阵保留的副对角线的数量。注意，如

Tensorflow1.15实现Transformer(一):使用self-attention来实现文本分类

qq_19865329的博客

04-24

7526

要学会一个算法，最好的办法还是自己复现一遍这里也是对自己学习的过程做一个记录了o(￣▽￣)ブ Transformer介绍 Transformer结构是google在17年的Attention Is All You Need论文中提出，在NLP的多个任务上取得了非常好的效果，可以说目前NLP发展都离不开transformer。最大特点是抛弃了传统的CNN和RNN，整个网络结构完全是由Attention机制组成。由于其出色性能以及对下游任务的友好性或者说下游任务仅仅微调即可得到不错效果，在计算机视觉领域不断

Tf2.0+基于注意力的神经机器翻译训练发布过程

蓝灯鱼

09-27

873

本篇是人工智能、机器翻译的干货文章，面向从事人工智能的研发工程师和翻译领域的职业从业者。意在译员能更好的从计算机编程角度理解机器翻译的代码实现过程。同时也和机器翻译开发工程师共同分享源码的快乐。实例是采用当下最新的tensorflow2.0+框架，实现transformer模型 Attention（注意力）、MultiHeadAttention（多头注意力）、位置嵌入、掩码、按层提取翻译结果、Flask服务发布。实例代码为完整代码，拷贝即可运行，如果有兴趣获得完整的.py代码请在公众号下留言，获得代码文

莫烦nlp-GPT 单向语言模型

ronghwa_lu

03-06

758

视频链接：https://mofanpy.com/tutorials/machine-learning/nlp/gpt/ 学习原因： GPT比bert的学习效率高在莫烦代码中，bert是继承GPT的，学习GPT较快知识追踪领域中，使用前一题预测后一题，不能对后面的预测泄露信息，属于单向模型。那就开始我们的学习吧。模型Generative Pre-Training (GPT) 模型越来越大的好处很显而易见，模型能用更多非线性能力处理更复杂的问题。但是由此带来另一个难题，就是难以训练。每训练一个

tensorflow2之数学运算

allen的博客

05-20

2242

官方API 大部分数学运算：tf.math 随机数：tf.random 矩阵运算：tf.linalg 乘法：tf.matmul（实际上是tf.linalg.matmul），等同于@ 转置：tf.transpose() 生成对角阵：tf.linalg.diag：可定制对角线上一行/下一行等信息获取对角阵元素：tf.linalg.diag_part 逆：tf.linalg.inv() 求迹：tf.linalg.trace() 范数：tf.linalg.norm() 行列式：tf.linalg.det()

tf API 研读2：math

MachineLP的专栏

09-05

4363

TF API数学计算 tf...... ：math （1）刚开始先给一个运行实例。 tf是基于图（Graph）的计算系统。而图的节点则是由操作（Operation）来构成的，而图的各个节点之间则是由张量（Tensor）作为边来连接在一起的。所以Tensorflow的计算过程就是一个Tensor流图。Tensorflow的图则是必须在一个Session中来计算。

TensorFLow 数学运算

zywvvd的博客

11-21

4万+

一、Tensor 之间的运算规则相同大小 Tensor 之间的任何算术运算都会将运算应用到元素级不同大小 Tensor(要求dimension 0 必须相同) 之间的运算叫做广播(broadcasting)Tensor 与 Scalar(0维 tensor) 间的算术运算会将那个标量值传播到各个元素Note： TensorFLow 在进行数学运算时，一定要求各个 Tensor 数据类型一致

对下面代码进行改错 import tensorflow.compat.v1 as tf tf.compat.v1.disable_eager_execution() from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets('MNIST_data', one_hot=True) num_classes = 10 input_size = 784 hidden_units_size = 30 batch_size = 100 training_iterations = 10000 X = tf.placeholder(tf.float32, [None, input_size]) Y = tf.placeholder(tf.float32, [None, num_classes]) W1 = tf.Variable(tf.random_normal([input_size, hidden_units_size],stddev = 0.1)) B1 = tf.Variable(tf.constant([hidden_units_size])) W2 = tf.Variable(tf.random_normal ([hidden_units_size,num_classes],stddev = 0.1)) B2 = tf.Variable(tf.constant(0.1), [num_classes]) hidden_opt = tf.matmul(X, W1) + B1 hidden_opt = tf.nn.relu(hidden_opt) final_opt = tf.matmul(hidden_opt, W2) + B2 final_opt = tf.nn.relu(final_opt) loss1 = tf.nn.softmax_cross_entropy_with_logits(labels=Y, logits=final_opt) loss = tf.reduce_mean(loss1) opt = tf.train.GradientDescentOptimizer(0.05).minimize(loss) init = tf.global_variables_initializer() correct_prediction = tf.equal(tf.argmax(Y,1), tf.argmax(final_opt,1)) accuracy = tf.reduce_mean(tf.cast(correct_prediction, 'float')) sess = tf.Session() sess.run(init) for i in range(training_iterations): batch = mnist.train.next_batch(batch_size) batch_input = batch[0] batch_labels = batch[1] train_loss = sess.run([opt, loss], feed_dict={X: batch_input, Y: batch_labels}) if i % 100 == 0: train_accuracy = accuracy.eval (session = sess, feed_dict={X: batch_input, Y: batch_labels}) print("step %d, training accuracy %g" % (i, train_accuracy))

最新发布

04-01

<think>好的，我需要帮助修复用户提供的TensorFlow v1.x代码中的错误，用于训练MNIST数据集。首先，我需要回顾用户提供的引用内容，了解可能的错误来源和修复方法。用户提到了引用[2]和引用[3]，其中引用[2]讨论了TensorFlow模型的持久化，而引用[3]涉及将TensorFlow 1.x代码迁移到2.x的问题。可能用户的代码是使用旧版本的TensorFlow编写的，而他们可能在较新的环境中运行，导致兼容性问题。常见的TensorFlow 1.x到2.x的迁移问题包括： 1. 使用`tf.Session`和`tf.placeholder`，这些在2.x中默认被禁用。 2. 需要显式启用v1兼容模式，例如通过`tf.compat.v1`。 3. Keras API的整合，在2.x中推荐使用tf.keras而不是单独的keras。用户提供的代码可能包含上述问题。例如，如果代码使用了`tf.placeholder`而没有启用v1兼容模式，或者混合使用了tf.keras和旧的tf.layers，就会出错。接下来，我需要假设用户提供的代码可能是什么样的。例如，用户可能在代码中使用了类似以下的结构： ```python import tensorflow as tf x = tf.placeholder(tf.float32, [None, 784]) y = tf.placeholder(tf.float32, [None, 10]) W = tf.Variable(tf.zeros([784, 10])) b = tf.Variable(tf.zeros([10])) pred = tf.matmul(x, W) + b loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y, logits=pred)) train_step = tf.train.GradientDescentOptimizer(0.5).minimize(loss) init = tf.global_variables_initializer() sess = tf.Session() sess.run(init) for _ in range(1000): batch_xs, batch_ys = mnist.train.next_batch(100) sess.run(train_step, feed_dict={x: batch_xs, y: batch_ys}) ``` 这段代码在TensorFlow 2.x中会报错，因为Session和placeholder已被移除。因此，修复的方法包括启用v1兼容模式或迁移到原生TF2代码。根据引用[3]，用户可能需要将代码转换为TensorFlow 2.x。因此，建议用户采用tf.keras接口，或者使用兼容模块。例如，可以添加`tf.compat.v1.disable_eager_execution()`来禁用即时执行，但更好的做法是重构代码以使用Keras。此外，引用[2]提到模型持久化的问题，可能在保存或加载模型时出现错误，例如使用旧的保存方式而不是tf.keras的save/load方法。可能的修复步骤包括： 1. 导入正确的模块，如使用`tf.compat.v1`。 2. 替换placeholder为Keras Input层或使用tf.data.Dataset。 3. 使用Keras的层和模型结构。 4. 使用tf.keras优化器和损失函数。 5. 确保保存模型时使用正确的方法，如model.save()。例如，修改后的代码可能如下： ```python import tensorflow as tf from tensorflow.keras.datasets import mnist from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense from tensorflow.keras.optimizers import SGD (x_train, y_train), (x_test, y_test) = mnist.load_data() x_train = x_train.reshape(-1, 784).astype('float32') / 255 y_train = tf.keras.utils.to_categorical(y_train, 10) model = Sequential([ Dense(10, activation='softmax', input_shape=(784,)) ]) model.compile(optimizer=SGD(0.5), loss='categorical_crossentropy', metrics=['accuracy']) model.fit(x_train, y_train, epochs=10, batch_size=100) ``` 这样避免了使用Session和placeholder，符合TensorFlow 2.x的实践。同时，保存模型时使用model.save()，如引用[2]所述。此外，检查是否加载了正确的MNIST数据集，可能需要使用tf.keras.datasets.mnist.load_data()而不是旧的方法。数据预处理步骤如归一化和reshape是否正确，输出层是否有正确的激活函数（如softmax），以及损失函数是否正确（如交叉熵）。如果用户仍然需要运行旧版代码，可以建议他们使用： ```python import tensorflow.compat.v1 as tf tf.disable_v2_behavior() ``` 然后按照原有代码结构进行调整，但推荐迁移到Keras以提高兼容性和维护性。总结可能的错误点： - 未处理TensorFlow 1.x到2.x的兼容性。 - 使用已弃用的API如Session、placeholder。 - 数据预处理不正确。 - 模型保存方法不正确。通过逐步检查这些方面，可以修复用户的代码。</think>以下是为您修复的TensorFlow MNIST训练代码及详细说明： ### 修复后的TensorFlow 2.x实现（推荐） ```python import tensorflow as tf from tensorflow.keras import layers, losses # 加载数据并预处理 (x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data() x_train = x_train.reshape(-1, 784).astype('float32') / 255.0 # 归一化[^2] y_train = tf.one_hot(y_train, 10) # 独热编码 # 构建模型 model = tf.keras.Sequential([ layers.Dense(10, activation='softmax', input_shape=(784,)) ]) # 编译模型 model.compile( optimizer=tf.keras.optimizers.SGD(learning_rate=0.5), loss=losses.CategoricalCrossentropy(), metrics=['accuracy'] ) # 训练模型 model.fit(x_train, y_train, batch_size=100, epochs=10, validation_split=0.2) # 保存模型 model.save('mnist_model.h5') # 持久化模型 ``` ### TensorFlow 1.x兼容模式实现 ```python import tensorflow.compat.v1 as tf tf.disable_v2_behavior() # 加载数据 from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets("MNIST_data/", one_hot=True) # 构建计算图 x = tf.placeholder(tf.float32, [None, 784]) y = tf.placeholder(tf.float32, [None, 10]) W = tf.Variable(tf.zeros([784, 10])) b = tf.Variable(tf.zeros([10])) pred = tf.nn.softmax(tf.matmul(x, W) + b) loss = tf.reduce_mean(-tf.reduce_sum(y * tf.log(pred), reduction_indices=1)) train_step = tf.train.GradientDescentOptimizer(0.5).minimize(loss) # 训练会话 with tf.Session() as sess: sess.run(tf.global_variables_initializer()) for epoch in range(10): total_batch = int(mnist.train.num_examples/100) for _ in range(total_batch): batch_xs, batch_ys = mnist.train.next_batch(100) sess.run(train_step, feed_dict={x: batch_xs, y: batch_ys}) # 保存模型 saver = tf.train.Saver() # 模型持久化 saver.save(sess, './mnist_model.ckpt') ``` ### 主要修复点说明 1. **版本兼容性处理** - 使用`tf.compat.v1`模块保持1.x API兼容性 - 增加`tf.disable_v2_behavior()`禁用默认的eager execution模式[^3] 2. **数据预处理优化** - 添加数据归一化（/255.0） - 使用one-hot编码替代原始标签 - 调整数据维度适配全连接层输入 3. **模型结构改进** - 明确添加softmax激活函数 - 使用交叉熵损失函数代替原始计算方式 4. **模型持久化实现** - 使用`tf.train.Saver()`保存检查点文件 - 推荐TF2版本使用`model.save()`保存完整模型[^2] 5. **训练过程优化** - 添加验证集划分（validation_split=0.2） - 规范epoch/batch训练流程