FPGA低功耗热感知加法器设计

AI助手已提取文章相关产品:

基于晶体管尺寸调整的FPGA低功耗热感知加法器设计

摘要

在本研究中,我们将寻找在90纳米、65纳米、45纳米、40纳米和38纳米工艺技术的现场可编程门阵列中,最具热效率和节能优势的技术,同时寻找最优的气流和散热器配置。我们还对 273.15K‐343.15K温度范围进行了热分析。当我们将基于65纳米和28纳米工艺技术的现场可编程 门阵列环境温度从343.15开尔文降低到283.15开尔文时,在250LFM条件下漏电功耗分别降低了 31.67%和75.71%;在500LFM条件下漏电功耗分别降低了58.53%和75.71%。同样条件下,结 温在250LFM时分别降低了84.54%和85.65%,在500LFM时分别降低了84.90%和85.65%。本 研究中使用的器件包括:90纳米Spartan‐3E 现场可编程门阵列、65纳米Virtex‐5 现场可编程门 阵列、45纳米Spartan‐6 现场可编程门阵列、40纳米Virtex‐6 现场可编程门阵列以及28纳米 Artix‐7 现场可编程门阵列。实验中采用了两种不同的气流条件:250LFM和500LFM。LFM是 气流单位,表示线性英尺每分钟。加法器是我们的目标设计。

引言

在本文中,我们将研究晶体管尺寸调整对现场可编程门阵列的影响。我们采用基于90纳米、65纳 米、45纳米、40纳米和38纳米工艺技术的现场可编程门阵列。我们的主要目的是开发一种节能 设计的方法论。为此,我们正在寻找最节能的技术、最节能的气流以及最节能的散热器配置。加 法器是超大规模集成电路中最简单且基本的设计。加法器也被用作许多电路的基本构建模块。

示意图0

示意图1

适用于加法器的技术必然适用于任何复杂的超大规模集成电路设计。因此,我们将分析限定在加法器上。

在本研究中,我们考虑了如图1所示的基于90纳米技术的Spartan‐3E 现场可编程门阵列、基于65纳米技术 的Virtex‐5 现场可编程门阵列、基于45纳米技术的Spartan‐6 现场可编程门阵列、基于40纳米技术的 Virtex‐6 现场可编程门阵列,以及基于28纳米技术的Artix‐7 现场可编程门阵列。我们采用了如图2所示的 两种不同的气流:250LFM和500LFM。LFM是气流的单位,即线性英尺每分钟。在国际单位制中,LFM相 当于0.01m/s。来自空调、冷却器或风扇的空气流动总会给我们带来舒适的感觉。

示意图2

示意图3

类似地,以热量形式耗散功率的器件,在散热器上安装风扇提供气流时也会有良好的散 热效果。器件的温度称为结温,环境的温度称为环境温度。结温也高于环境温度。用数学术 语表示,结温是环境温度与TJA和TP乘积的总和。这里的环境是一个广义术语,包括外壳、 散热器和房间,如图3所示。上述为热量流动示意图。TP是所考虑设计的总功耗。TJA是结 到环境的热阻。工作中的现场可编程门阵列(FPGA)的结点作为热源,环境作为散热器[1]。

目前在热感知设计方面已有大量研究工作正在进行[1‐9] 。在研究现有的热感知设计方法论 过程中,我们查阅了热感知FIR滤波器设计[2], 、温度感知设计的热建模[3], 、热感知算术 逻辑单元(ALU)[4], 、NoC中的热平衡设计[5], 、热感知 Unicode读取器[6], 、热感知 3D微处理器[7], 、帧缓冲器(Frame Buffer)[8]以及微架构级别的热感知布局规划[9]。

JT通过AT、热功率和TJA来衡量,如图4所示。其中,TJA是结到环境的热阻(℃/W), 热功率是设计的总功耗。TJA热阻是TJC(结到外壳的热阻)、TCS(外壳到散热器的热阻) 和TSA(散热器到环境的热阻)三项热阻的总和,如图1[1]所示。

示意图4

示意图5

我们使用了三种不同类型的散热器,如图5所示。分别是低轮廓散热器、中型散热片和高型 散热片。特别地,我们还考虑了不使用任何散热器的情况,并将该情况专门归类为无散热器。我 们的目标设计采用三个输入:输入1、输入2和进位输入,并计算进位输出和和,如图6所示。

250 LFM和500LFM下的功耗

表1 无轮廓散热器和低轮廓散热器的功耗

环境温度 250 LFM 90纳米 250 LFM 65纳米 500LFM 90纳米 500LFM 65纳米 250 LFM 40纳米 250 LFM 28纳米 500LFM 40纳米 500LFM 28纳米
283.15开尔文 0.032 0.248 0.026 0.248 1.041 0.034 1.039 0.03
298.15开尔文 0.034 0.289 0.027 0.289 1.121 0.042 1.118 0.042
313.15开尔文 0.036 0.342 0.029 0.341 1.218 0.058 1.214 0.058
328.15开尔文 0.039 0.410 0.031 0.409 1.338 0.087 1.332 0.087
343.15开尔文 0.043 0.499 0.033 0.495 1.484 0.140 1.477 0.140

在250 LFM条件下,基于90纳米、65纳米工艺技术的现场可编程门阵列漏电功耗分别降低了25.58%、 50.30%,基于40纳米、28纳米工艺技术的现场可编程门阵列漏电功耗分别降低了29.85%、75.71%。

当我们将环境温度从343.15K降低到283.15K时,对于500 LFM,基于90nm、65nm工艺 技术的FPGA漏电功耗分别减少了21.21%、49.89%,基于40nm、28nm工艺技术的 FPGA漏电功耗分别减少了29.65%、75.71%,如表2所示,相应数据如表1所示。

示意图6

示意图7

对于基于90纳米和65纳米工艺技术的FPGA,当气流从250LFM增加到500LFM、环境温度为328.15开 尔文和343.15开尔文时,漏电功耗分别降低了20.51%、23.26%和48.80%,如图7所示;对于基于40纳米和 28纳米工艺技术的FPGA,漏电功耗分别降低了20.68%、44.84%和0.00%,如图8所示。

表2:中型散热片的功耗

环境温度 250LFM 65纳米 250LFM 40纳米 500LFM 65纳米 500LFM 40纳米 250LFM 65纳米 250LFM 28纳米 500LFM 65纳米 500LFM 28纳米
283.15开尔文 1.289 1.373 1.282 1.368 1.289 0.034 1.280 0.034
298.15开尔文 1.568 1.509 1.556 1.502 1.568 0.042 1.554 0.042
313.15开尔文 1.944 1.676 1.925 1.667 1.944 0.058 1.921 0.058
328.15开尔文 2.456 1.880 2.424 1.868 2.456 0.087 2.416 0.087
343.15开尔文 3.157 2.133 3.100 2.115 3.157 0.140 3.087 0.140

在250 LFM条件下,当环境温度从343.15开尔文降低到283.15开尔文时,基于65纳米、40纳米工 艺技术的现场可编程门阵列的漏电功耗分别减少了59.17%、35.63%;对于基于65纳米、28纳米工艺 技术的现场可编程门阵列,漏电功耗分别减少了31.67%、75.71%。在500 LFM条件下,当环境温度 从343.15开尔文降低到283.15开尔文时,基于65纳米和40纳米工艺技术的现场可编程门阵列的漏电功 耗分别减少了58.64%、35.31%,而基于65纳米、28纳米工艺技术的现场可编程门阵列的漏电功耗分 别减少了58.53%、75.71%,如表2所示。

示意图8

示意图9

250 LFM和500LFM的最高环境温度

表3 无轮廓和低轮廓散热器的最高环境温度

环境温度 250LFM 90纳米 250LFM 65纳米 500LFM 90纳米 500LFM 65纳米 250LFM 40纳米 250LFM 28纳米 500LFM 40纳米 500LFM 28纳米
283.15开尔文 83.7 83.4 83.8 83.4 81.9 84.9 82.5 84.9
298.15开尔文 83.6 83.4 83.8 83.4 81.9 84.9 82.5 84.9
313.15开尔文 83.5 83.1 83.7 83.1 81.7 84.9 82.3 84.9
328.15开尔文 83.4 82.8 83.6 83.0 81.4 84.8 82.0 84.8
343.15开尔文 83.2 82.3 83.5 82.6 81.1 84.7 81.7 84.7

对于250 LFM,当环境温度从283.15开尔文升高到343.15开尔文时,基于90纳米、65纳米工艺技术的 现场可编程门阵列最高环境温度分别降低了59.73%、2.03%,基于40纳米、28纳米工艺技术的现场可 编程门阵列最高环境温度分别降低了59.73%、2.03%。对于500 LFM,如表3所示,当环境温度从 283.15开尔文升高到343.15开尔文时,基于90纳米、65纳米工艺技术的现场可编程门阵列最高环境温 度分别降低了47.73%、1.5%;基于40纳米、28纳米工艺技术的现场可编程门阵列最高环境温度分别 降低了1.3%、35.33%。

表4 中型和高型散热片的最高环境温度

环境温度 250LFM 65纳米 250LFM 40纳米 500LFM 65纳米 500LFM 40纳米 250LFM 65纳米 250LFM 28纳米 500LFM 65纳米 500LFM 28纳米
283.15开尔文 83.5 81.6 82.2 84.0 83.7 84.9 84.1 84.9
298.15开尔文 83.2 81.6 82.2 84.0 83.7 84.9 84.1 84.9
313.15开尔文 82.8 81.2 81.9 83.8 83.5 84.9 83.9 84.9
328.15开尔文 82.2 80.8 81.6 83.5 83.1 84.8 83.6 84.8
343.15开尔文 81.4 80.3 81.2 83.1 82.6 84.7 83.3 84.8

对于250 LFM,当环境温度从283.15开尔文升高到343.15开尔文时,基于65纳米、40 纳米工艺技术的现场可编程门阵列的最大环境温度分别降低了2.51%、2.32%,以及最大环 境温度分别降低了2.15%、35.3%。对于500 LFM,当环境温度从283.15开尔文升高到 343.15开尔文时,如表4所示,基于65纳米、40纳米工艺技术的现场可编程门阵列的最大环 境温度分别降低了1.8%、1.78%,以及最大环境温度分别降低了1.5%、35.3%。

250 LFM和500LFM的结温

表5 无轮廓与低轮廓散热器的结温

环境温度 250LFM 90纳米 250LFM 65纳米 500LFM 90纳米 500LFM 65纳米 250LFM 40纳米 250LFM 28纳米 500LFM 40纳米 500LFM 28纳米
283.15开尔文 11.3 11.6 11.2 11.6 13.1 10.1 12.5 10.1
298.15开尔文 26.4 26.9 26.3 26.9 28.3 25.1 27.7 25.1
313.15开尔文 41.5 42.2 41.4 42.0 43.6 40.2 43.0 40.2
328.15开尔文 55.6 57.7 56.5 57.4 58.9 55.3 58.3 55.3
343.15开尔文 71.8 71.6 72.9 74.4 70.5 73.6 70.5 73.3

在250 LFM条件下,当环境温度从343.15开尔文降至283.15开尔文时,基于90纳米、65纳米工艺技术 的现场可编程门阵列结温分别降低了84.26%、84.17%,基于40纳米、28纳米工艺技术的现场可编程 门阵列结温分别降低了82.39%、85.67%。在500 LFM条件下,当环境温度从343.15开尔文降至 283.15开尔文时,如表5所示,基于90纳米、65纳米工艺技术的现场可编程门阵列结温分别降低了 84.35%、84.08%,基于40纳米、28纳米工艺技术的现场可编程门阵列结温分别降低了83.01%、 85.67%。

示意图10

示意图11

当我们将气流从250LFM增加到500LFM,环境温度为328.15开尔文、343.15开尔文时,基于90 纳米和65纳米工艺技术的FPGA结温分别降低了1.5%、27.9%和51.9%、54.5%,如图11所示;而基 于40纳米和28纳米工艺技术的FPGA结温分别降低了1.01%、1.07%,且无明显降低,如图12所示。

表6 中型散热片与高型散热片的结温

环境温度 250LFM 65纳米 250LFM 40纳米 500LFM 65纳米 500LFM 40纳米 250LFM 65纳米 250LFM 28纳米 500LFM 65纳米 500LFM 28纳米
283.15开尔文 11.5 13.4 11.0 12.1 11.3 10.1 10.9 10.1
298.15开尔文 26.8 28.8 26.2 28.1 26.5 25.1 26.1 25.1
313.15开尔文 42.2 44.2 41.5 43.4 41.9 40.2 41.4 40.2
328.15开尔文 57.8 59.7 56.9 58.8 57.4 55.3 56.7 55.2
343.15开尔文 73.6 75.3 72.5 74.3 73.1 70.4 72.2 70.4

在250 LFM条件下,当环境温度从343.15K降低到283.15K时,基于65nm、40nm工 艺技术的FPGA结温分别降低了84.37%、82.20%,基于65nm、28nm工艺技术的FPGA结 温分别降低了54%、85.65%。在500 LFM条件下,当环境温度从343.15K降低到283.15K 时,基于65nm、40nm工艺技术的FPGA结温分别降低了84.82%、83.71%,基于65nm、 28nm工艺技术的FPGA结温分别降低了84.90%、85.65%,如表6所示。

示意图12

示意图13

当我们将气流从250LFM增加到500LFM时,对于基于65 nm和40nm工艺技术的现场可编程门阵 列,在环境温度为328.15开尔文、343.15开尔文的情况下,结温分别降低了1.55%、1.49%、1.50%、 1.32%(如图13所示);而对于基于65nm和28nm工艺技术的现场可编程门阵列,在环境温度为 328.15开尔文、343.15开尔文的情况下,结温分别降低了1.21%、1.23%,且无降低(如图14所示)。

结论

在5种不同工艺技术中,基于90纳米技术的现场可编程门阵列漏电功耗最小,而基于40纳米技术的现场可编 程门阵列漏电功耗最大。同样,在90纳米、65纳米、45纳米、40纳米和28纳米工艺技术的现场可编程门阵 列中,最高环境温度在28纳米技术中最高,在40纳米技术中最低。根据我们的热分析观察结果,结温在基于 40纳米技术的现场可编程门阵列中最高,在基于28纳米技术的现场可编程门阵列中最低。

未来展望

该设计在90纳米、65纳米、45纳米、40纳米和28纳米的现场可编程门阵列上实现。未来,我们 可以进一步拓展至超大规模现场可编程门阵列、片上系统和三维集成电路。本研究中的目标设计 为加法器。未来,热感知和节能型算术逻辑单元、数学协处理器、处理器以及多核架构的设计具 有广阔的发展空间。本设计在273.15K‐343.15K的控制温度下进行仿真。未来,可以开展适用于 北极、赤道或超出273.15K‐343.15K范围等极端温度环境下的设计。未来展望包括改善功耗,因 为加法器作为电路中广泛存在的核心元件,功耗是主要影响因素。对于未来的现场可编程门阵列 电路而言,优化进位路径以支持基于树的设计,从而优化布局与布线,将是充分且必要的发展方 向。

您可能感兴趣的与本文相关内容

【四旋翼无人机】具备螺旋桨倾斜机构的全驱动四旋翼无人机:建模与控制研究(Matlab代码、Simulink仿真实现)内容概要:本文围绕具备螺旋桨倾斜机构的全驱动四旋翼无人机展开研究,重点探讨其系统建模与控制策略,结合Matlab代码与Simulink仿真实现。文章详细分析了无人机的动力学模型,特别是引入螺旋桨倾斜机构后带来的全驱动特性,使其在姿态与位置控制上具备更强的机动性与自由度。研究涵盖了非线性系统建模、控制器设计(如PID、MPC、非线性控制等)、仿真验证及动态响应分析,旨在提升无人机在复杂环境下的稳定性和控制精度。同时,文中提供的Matlab/Simulink资源便于读者复现实验并进一步优化控制算法。; 适合人群:具备一定控制理论基础和Matlab/Simulink仿真经验的研究生、科研人员及无人机控制系统开发工程师,尤其适合从事飞行器建模与先进控制算法研究的专业人员。; 使用场景及目标:①用于全驱动四旋翼无人机的动力学建模与仿真平台搭建;②研究先进控制算法(如模型预测控制、非线性控制)在无人机系统中的应用;③支持科研论文复现、课程设计或毕业课题开发,推动无人机高机动控制技术的研究进展。; 阅读建议:建议读者结合文档提供的Matlab代码与Simulink模型,逐步实现建模与控制算法,重点关注坐标系定义、力矩分配逻辑及控制闭环的设计细节,同时可通过修改参数和添加扰动来验证系统的鲁棒性与适应性。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值