初识Tensorflow2.1

本文探讨了如何在TensorFlow中使用GPU加速矩阵运算,包括创建张量、指定GPU设备进行计算,以及通过时间测试对比CPU与GPU的运算效率。实验展示了不同规模矩阵乘法在GPU上的显著速度优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、命令式编程

import tensorflow as tf
# 1.创建输入张量
a = tf.constant(2.)
b = tf.constant(4.)
# 2.直接计算并打印
print('a+b=',a+b)

2、利用GPU加速计算

注:指定运行在CPU上还是GPU上。tensorflow中不同的GPU使用/gpu:0和/gpu:1区分,而CPU不区分设备号,统一使用 /cpu:0

tf.matmul()函数的使用(知识点:创建数组,数组相乘):

import tensorflow as tf
import numpy as np
a = [1,2,3]
b = np.array([a])
c = np.transpose(b)
d = tf.matmul(b,c)
print(a,b,c,d)

 

在/gpu:0上进行数组乘法计算:

import tensorflow as tf 
import matplotlib
from matplotlib import pyplot as plt
import os 
import numpy as np
os.environ['TF.CPP.MIN.LOG.LEVEL'] = '2'
n = 100
with tf.device('/gpu:0'):
    cpu_a = tf.random.normal([1,n])
    cpu_b = tf.random.normal([n,1])
    cpu_c = tf.matmul(cpu_a,cpu_b)
x = [i for i in range(9)]       # for 循环产生数组
print(x,cpu_a,cpu_b,cpu_c)
cpu_a = np.transpose(cpu_a)
plt.plot(cpu_a,label='cpu_a')
plt.plot(cpu_b,label='cpu_b')
plt.legend()
plt.show()

cpu_b如下图所示: 

 测试一:

import tensorflow as tf
import matplotlib
from matplotlib import pyplot as plt

import timeit
cpu_data = []
gpu_data = []
for n in range(9):
    n = 9**n
    # 创建在 CPU 上运算的 2 个矩阵
    with tf.device('/cpu:0'):
        cpu_a = tf.random.normal([1, n])    # 符合正态分布、随机选取
        cpu_b = tf.random.normal([n, 1])
        print(cpu_a.device, cpu_b.device)
    # 创建使用 GPU 运算的 2 个矩阵
    with tf.device('/gpu:0'):
        gpu_a = tf.random.normal([1, n])
        gpu_b = tf.random.normal([n, 1])
        print(gpu_a.device, gpu_b.device)
    def cpu_run():
        with tf.device('/cpu:0'):
            c = tf.matmul(cpu_a, cpu_b)     # 矩阵相乘
        return c
    def gpu_run():
        with tf.device('/gpu:0'):
            c = tf.matmul(gpu_a, gpu_b)
        return c
    # 第一次计算需要热身,避免将初始化阶段时间结算在内
    cpu_time = timeit.timeit(cpu_run, number=10)        # 测量运算时间    number为测试次数
    gpu_time = timeit.timeit(gpu_run, number=10)
    print('warmup:', cpu_time, gpu_time)
    # 正式计算 10 次,取平均时间
    cpu_time = timeit.timeit(cpu_run, number=10)
    gpu_time = timeit.timeit(gpu_run, number=10)
    print('run time:', cpu_time, gpu_time)
    cpu_data.append(cpu_time/10)    # 在数组后加上相应的元素
    gpu_data.append(gpu_time/10)
    del cpu_a,cpu_b,gpu_a,gpu_b     # 删除对应的变量而不是值
    print(cpu_data)
    print(gpu_data)
x = [9**i for i in range(9)]
cpu_data = [1000*i for i in cpu_data]
gpu_data = [1000*i for i in gpu_data]
plt.plot(x, cpu_data, 'C1')
plt.plot(x, cpu_data, color='C1', marker='s', label='CPU')
plt.plot(x, gpu_data,'C0')
plt.plot(x, gpu_data, color='C0', marker='^', label='GPU')
plt.gca().set_xscale('log')
plt.gca().set_yscale('log')
#plt.ylim([0,100])
plt.xlabel('矩阵大小n:(1xn)@(nx1)')
plt.ylabel('运算时间(ms)')
plt.legend()
plt.show()

 

 对测试一进行一定的修改:

import tensorflow as tf
import matplotlib
from matplotlib import pyplot as plt

import timeit
cpu_data = []
gpu_data = []
for n in range(9):
    n = 9**n

    def cpu_run():
        with tf.device('/cpu:0'):
            cpu_a = tf.random.normal([1, n])    # 符合正态分布、随机选取
            cpu_b = tf.random.normal([n, 1])
            c = tf.matmul(cpu_a, cpu_b)     # 矩阵相乘
        return c
    def gpu_run():
        with tf.device('/gpu:0'):
            gpu_a = tf.random.normal([1, n])
            gpu_b = tf.random.normal([n, 1])
            c = tf.matmul(gpu_a, gpu_b)
        return c
    # 第一次计算需要热身,避免将初始化阶段时间结算在内
    cpu_time = timeit.timeit(cpu_run, number=10)        # 测量运算时间    number为测试次数
    gpu_time = timeit.timeit(gpu_run, number=10)
    print('warmup:', cpu_time, gpu_time)
    # 正式计算 10 次,取平均时间
    cpu_time = timeit.timeit(cpu_run, number=10)
    gpu_time = timeit.timeit(gpu_run, number=10)
    print('run time:', cpu_time, gpu_time)
    cpu_data.append(cpu_time/10)    # 在数组后加上相应的元素
    gpu_data.append(gpu_time/10)
    #del cpu_a,cpu_b,gpu_a,gpu_b     # 删除对应的变量而不是值
    print(cpu_data)
    print(gpu_data)
x = [9**i for i in range(9)]
cpu_data = [1000*i for i in cpu_data]
gpu_data = [1000*i for i in gpu_data]
plt.plot(x, cpu_data, 'C1')
plt.plot(x, cpu_data, color='C1', marker='s', label='CPU')
plt.plot(x, gpu_data,'C0')
plt.plot(x, gpu_data, color='C0', marker='^', label='GPU')
plt.gca().set_xscale('log')
plt.gca().set_yscale('log')
#plt.ylim([0,100])
plt.xlabel('矩阵大小n:(1xn)@(nx1)')
plt.ylabel('运算时间(ms)')
plt.legend()
plt.show()

 

 

import tensorflow as tf 
import matplotlib
from matplotlib import pyplot as plt
import os 
os.environ['TF.CPP.MIN.LOG.LEVEL'] = '2'
n = 100
with tf.device('/gpu:0'):
    cpu_a = tf.random.normal([1,n])
    cpu_b = tf.random.normal([n,1])
    cpu_c = tf.matmul(cpu_a,cpu_b)
x = [i for i in range(9)]       # for 循环产生数组
print(x,cpu_a,cpu_b,cpu_c)
# plt.plot(cpu_a,label='cpu_a')
plt.plot(cpu_b,label='cpu_a')
plt.show()

import tensorflow as tf
# 创建 4 个张量
a = tf.constant(1.)
b = tf.constant(2.)
c = tf.constant(3.)
w = tf.constant(4.)
with tf.GradientTape() as tape:# 构建梯度环境
    tape.watch([w]) # 将 w 加入梯度跟踪列表
    # 构建计算过程
    y = a * w**2 + b * w + c
# 求导
[dy_dw] = tape.gradient(y, [w])
print(dy_dw) # 打印出导数
print()aprint(a)

输出结果:

 

极化码(Polar Code)是由土耳其科学家Erdal Arıkan在2009年提出的一种新型纠错编码技术。它通过利用信道的极化现象,将虚拟信道分为误码率接近0和接近1/2的两类。在编码设计中,数据被放置在误码率极低的信道上,从而实现高效的数据传输。极化码的主要优势在于其理论编码容量能够达到香农限,并且构造方法较为简单。 MATLAB是一种功能强大的数学计算和编程工具,广泛应用于科学研究和工程领域。在极化码的研究中,MATLAB可用于构建编码和解码算法,模拟数据在不同信道条件下的传输效果,验证理论性能,并优化相关参数。 SC(Successive Cancellation,逐位取消)译码是极化码的基本解码方法。它从最可靠的比特开始,依次解码每个虚拟信道,且每个比特的解码结果会影响后续比特的解码,因为它们之间存在依赖关系。虽然SC译码的实现较为简单,但其计算复杂度较高,随着码长的增加,解码时间会线性增长。 SCL(Successive Cancellation List,逐位取消列表)译码是SC译码的改进版本。它通过引入列表机制,同时处理多个路径,从而增强了错误校正能力,并在一定程度上降低了错误率。与SC译码相比,SCL译码虽然需要消耗更多的计算资源,但能够提供更好的性能。 一个完整的MATLAB仿真资源通常包含以下内容: 编码模块:用于实现极化码的生成,包括码字构造和极化矩阵操作等。 信道模型:用于模拟各种通信信道,例如AWGN(加性高斯白噪声)信道或衰落信道。 SC/SCL译码模块:包含SC译码和SCL译码的算法实现。 误码率(BER)计算:通过比较发送和接收的码字,计算误码率,以评估编码性能。 性能曲线绘制:绘制误码率与信噪比(SNR)之间的关系曲线,展示不同译码策略的性能差异。 使用说明:指导用户如何运行仿真,理解代码结构,以及如何调整参数以进行自定义实验。 代码注
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值