Memory及其controller芯片整体测试方案(下篇)

DDR与SSD高速接口测试
本文探讨了DDR总线的设计、调试与验证方法,包括DDR4眼图测试及信号完整性验证等内容。同时,介绍了NAND Flash颗粒与控制器间的高速接口调试方案,以及SSD高速接口的设计与验证方法。

{  第三部分  }

 DDR总线的设计、调试和验证 

在计算机架构中,DDR作为程序运算的动态存储器,面对如高性能计算、图形计算、移动计算、工业应用等领域的要求,发展出DDR4,以及用于图形计算的GDDR5, HBM2,面向移动计算的低功耗LPDDR4等标准。

处理器的运算速度越来越快,DDR的性能也要求越来越高,明显的趋势是DDR总线工作频率持续提升, DDR4 达到3.2GT/s, 用于智能手机等低功耗场合的LPDDR4速率甚至超越了DDR4,最高达到4.2GT/s,JEDEC在年中的论坛中提出未来的DDR5工作速率将达到6.4GT/s,由于速率的提升,DDR5中将可能考虑在接收端采用多阶DFE均衡器,而在强调性能的图形计算领域,规划中的GDDR6的工作速率可能会达到16GT/s。另一方面由于能耗比的要求,DDR标准在演进中工作电压持续走低,如LPDDR4X的工作电压降低至0.6V。  

DDR总线采用源同步的技术,多比特并行通信的机制,总线中会存在同步开关噪声和串扰等问题;由于信号速率持续提升单个比特位宽收窄,导致时序裕度变的很紧张,抖动问题也越发明显;而工作电压的降低,噪声和电源完整性的问题也变得非常显著。DDR4总线既有并行总线存在的问题,也要面临如同高速SERDES设计中存在的挑战,可以说是在数字系统中最为复杂的一环,如果不能保证DDR总线的可靠运行,有可能会导致整个硬件系统的崩溃。

针对这些问题,是德科技提供了从DDR4总线的设计仿真和分析,到系统上电后DDR4信号完整性验证、时序验证、眼图轮廓测试、电源完整性验证,以及总线时序一致性分析,故障定位,性能统计等等完整的解决方案。(如下图所示)

 

 

JEDEC协会定义的DDR4信号特性主要包括以下主要内容↘↘↘

Electrical

  • VIH/VIL,VOH/VOL

  • Overshoot/undershoot

  • Crossingpoint

Timing

  • Pre/Postamble timing

  • DQS/DQ/CLKDelta time

Eyediagram

  • RxInput Mask

其中电气特性和时序特性基本与之前DDR3等要求比较类似,眼图这一项是随着信号速率的提升,新增加的一个要求。可能有读者会问,以前DDR3或之前的测试,示波器软件也有眼图测试,到了DDR4对于眼图测试要求有什么区别吗?(篇幅所限,以上问题本文不再做进一步的详细解释,有兴趣的同学可以 点击下载>>>【DDR4眼图测试】全文了解。)

是德科技ADS仿真软件的DDR4总线仿真器,提供了统计眼图分析的功能,能够在短时间内统计计算在极低误码率(1e-16)下的DQ眼图,根据规范判断模板是否违规。另外基于总线的仿真,也很易于仿真基于串扰因素下的眼图质量。

 

 

 

基于示波器的DDR4信号实测,可以利用大家熟悉的InfiniiScan区域触发功能,很容易分离出“写”信号,再通过Gating功能对Burst写信号做时钟恢复和眼图重建,再进行Eye Contour测量,并验证1e-16误码率下的眼图模板是否违规。如果是使用一致性测试软件,就不用手动操作,软件会自动跟踪和分离波形并实现眼图测试(如下图所示)

 

 

 

DDR4做测试时,由于BGA信号难以探测,是德科技提供了N2114A/N2115A等DDR4 Interposer,将BGA下方的信号引到Interposer外围,方便探头焊接。

 

 

最后,对于物理层无论是仿真还是一致性测试软件得到的数据,都可以通过数据分析工具N8844A导入到云端,通过可视化工具,生成统计分析表格,对比性分析高低温、高低电压等极端情况下不同的测试结果,比较不同被测件异同。为开发测试部门提供灵活和有效的大数据分析平台。

 

 

以上,我们介绍了DDR4总线物理层仿真测试和协议层的测试方案,借助仿真软件、示波器和逻辑分析仪对DDR4总线分析调试的主要方法。

 

 

再通过逻辑分析仪的内存软件解析DDR总线的操作和分析性能,可以分析出由于系统中集中的读操作,以及LPDDR4的速率切换导致了电源电压的波动,以及特定命令操作导致的电压跌落现象。(详细技术细节,请点击下载>>>【DDR4眼图测试】进一步了解。)

 

{  第四部分  }

 NAND memory 颗粒

 和 controller 之间的高速接口调试 

 

NANDmemory 颗粒和其controller 之间的高速接口主要分以下几种↘↘↘

M-PHY(UFS)

SD UHS-II

eMMC

ONFi(Open NAND FLASH Interface)

 

 

 

以UFS为例,让我们分别来看这类高速接口的

1、物理层一致性测试

  • 发射端

  • 接收端

  • 接口及互连S参数和阻抗

2、协议层分析和测试

 

 

UFS2.1总线的分析验证方法

 

随着智能手机的爆炸式增长,移动存储技术也发生着巨大的变化,从早期手机内置存储器并且开放MicroSD存储卡接口,到现在多数手机只有内部固定存储器。

这些年eMMC技术被广泛使用,最新eMMC5.1标准理论最高传输速率可以达到400MB/s,但最近移动设备中越来越多采用了JEDEC协会定义的UFS协议。

UFS2.1协议基于MIPI M-PHY G3的物理层标准,使用两个通道,与eMMC比较,简单来说是将从并行改为串行架构,收发双向全双工传输,两路传输吞吐速率可以达到11.6Gbps。除了高速率性能,另外UFS具有很好的功耗性能,在移动领域有替代eMMC的趋势。我在这里总结了一下UFS与eMMC的主要差异:

 

 UFSeMMC

当前标准

2.1

5.1

物理层

M-PHY G3

N/A

链路层

UniPro  v1.6

N/A

接口

串行

并行

通道数

2

8 (11 w/  strobe)

双工

全双工

半双工

时钟架构

嵌入时钟

源同步

理想吞吐速率

5.8Gbps  x 2

HS400  max 3.2Gbps

编码

8b/10b, PWM

N/A

均衡

TX &  RX (G4)

N/A

下一代标准

UFS3.0,

M-PHY G4  11.6Gbps

N/A

一致性认证

UFSA:

  • Transaction Layer

MIPI/UNH-IOL:

  • Physical Layer: M-PHY

  • Link  Layer: UniPro

No  compliance program

 

>>> UFS的物理层测试方案

UFS采用分层结构,底层物理层采用MIPI联盟的M-PHY标准,数据链路层为UniPro,再上层协议层采用JEDEC协会定义的UFS协议。

UFS2.1架构如下图所示↘↘↘

 

▲ 上图引用自Arasan网站

 

 

>>> M-PHY物理层主要有如下主要的特点

每个信号通路是单向传输,信号采用差分传输机制,信号有高速HS和低速LS两种模式,高速信号采用8b/10b编码,使用PLL类型端时钟恢复,在突发的开始需要同步信号;低速信号则使用PWM调制方式。M-PHY有两种电压摆幅大幅度LA和小幅度SA,可以工作在端接模式和非端接模式,后一种可以在低功耗要求时使用。

 

 

M-PHY一致性测试规范包括了发射端,接收端,接口及互连S参数和阻抗三部分内容。

 

>>> 发射端测试方案如下:

 

 

详情请下载相关文档查看,点击下载>>>

 

>>> 接收端测试方案如下:

 

 

接收端的测试难点有几个方面:

  • 接收测试的原理是,激励压力信号到接收端,环回后测试误码率,压力信号通常包括随机抖动Rj,确定性抖动包括ISI和正弦抖动Sj扫描,激励源允许加入去加重,环回后测试设备需要通过CDR恢复时钟,进而测试误码率。是德科技M8020A误码仪集成经过校准的Rj,BUJ, PJ,SSC等抖动源,内置可调节ISI,可以直接按照规范规定的CH1/CH2的插入损耗要求生成ISI。内置CDR从环回信号恢复时钟测试误码率。

  • 在做UFS接收测试时,芯片有可能内置参考时钟如19.2MHz不能外部输入,这就要求误码仪与被测芯片提供的时钟同步,对于G3的信号速率5.8Gb/s,要求内部倍频304倍,如果是G4的速率11.6Gb/s,需要倍频608倍,M8020A的0G6选件可以直接外部参考时钟输入倍频后产生G3/G4要求的速率信号激励给被测件。

  • CTS除了要求接收容忍度测试之外,也会测试2.1.6 – HS-RXLane-to-Lane Skew (TL2L-SKEW-HS-RX),这一项是要求测试接收端的通道与通道间对skew的容忍度,这就要求激励源有2个通道,M8020A误码仪可以支持4通道16.2Gbps的发生和误码检测通道。

 

>>> 互连S参数和阻抗测试方案:

 

 

 

需要注意的是测试SDD21回波损耗的时候,被测件需要在工作状态并发出CRPAT码型的情况下做测试,TDR需要加入大量平均以减少被测信号发射波形的影响,这种测试推荐使用网络仪完成,可以调整发射功率和减少IFBW减少DUT发射信号对测量的影响,是德科技VNA E5071C带有TDR选件功能,可以从频域到时域实现完整的测试要求。

 

>>> UFS协议层分析和测试方案:

 

 

 

上图展示了是德科技U4431A UFS协议分析仪和捕获分析UFS链路协议的界面,U4431A支持M-PHY G3速率等级,采集深度16GB,可以支持双向各4个lane。

 

{  第五部分  }

 SSD高速接口的设计与验证 

 

SSD是Solid State Drive也就固态盘的简写,作用如同传统硬盘,在系统掉电后,仍可以保持存储数据和程序。当然也有Intel美光等公司开发基于高速固态存储器技术3DXpoint也可以用于动态访问应用,这里由于篇幅所限,不在本文的讨论范围之内。

相较于机械硬盘,SSD访问速度大幅提升,也有噪音低、不怕碰撞等优点。从这些年的发展来看,SSD容量大幅度提升,成本也逐步降低,在消费领域或者企业市场已经有很大的普及。

现在的SSD多数采用TLC或MLC NANDFlash作为存储介质,除了NAND存储器颗粒之外,在SSD架构中,通常包括SSD控制器实现存储器的访问控制、缓冲器管理和特定的算法,也包括DDR 存储器实现数据缓冲和计算,以及与主机通信的的高速接口。对于DDR的测试方案,前面我们做了介绍,这一部分,我们主要来讨论一下高速接口的部分。

 

▲ 摘自Coding forSSDs – Part 2: Architecture of an SSD and Benchmarking

 

SSD控制器主要接口类型的包括PCIe, SAS, SATA, USB等,这里我总结了这几种接口技术的主要差别。

由于标准PCIe和SAS接口技术的高性能和扩展性,一般更多用于企业应用,而SATA和USB接口通常用于个人消费领域。

从使用的接口类型来看,PCIe协会PCISIG定义了除标准接口之外,还支持包括U.2, SATA Express以及m.2接口,并在最近也开发定义了OCulink的电缆接口。从这几种标准来看,以PCIe3.0为代表,采用了更加复杂的编码格式,以提升传输效率,另外发射接收端均衡能力也有很大提升,比如PCIe3.0在规范中定义了链路均衡训练机制,RC和EP芯片通过链路协商调整预加重和接收均衡,使得系统误码率维持在低水平。

 

 

首先我们先来了解PCIe总线的情况。2017年10月,PCISIG正式发布了PCIe4.0基础规范1.0版本,这是PCIe规范发展的一个重要里程碑,另外PCIe协会预计会在2019年正式发布PCIe5.0规范。PCIe4.0的传输速度比3.0加倍,达到16GT/s,相信在未来陆续会有支持4.0的CPU、外设产品陆续发布。当然对于NVMe协议来说,短期来说主流还是基于PCIe3.0,未来也有可能有支持4.0的产品。

 

 

下面是PCIe3.0/4.0 NVMe SSD设备的发射端和接收端测试方案框图

 

 

 

其中发射端展示的是NVMe设备通过矩阵开关实现2路信号的自动化实测连接图,被测件通过PCIe3.0测试夹具CBB3,将被测件的两路或更多路信号连接到Keysight U3020矩阵开关,再将公共端口差分连接到是德科技Z系列或V系列示波器,通过示波器的Aux Out输出端口经过Balun连接到测试夹具的Rx0,由软件控制产生100MHz时钟触发被测件切换码型和preset。对于NVMe设备接收端测试,M8020A具有极高集成度,内置8阶发射端去加重,内置共模差模干扰,接收均衡,CDR,并具有链路协商机制,如图所示,整个链接环境非常简化,就可以完成接受容忍度测试,并且M8020A也是PCISIG官方推荐的链路均衡测试方案。

对于U.2(SFF-8639)接口,PCISIG发布了一致性测试夹具,下图展示了U.2接口的NVMe SSD卡的发射机测试连接实物图。可以使用SigTest进行参数测量,也可以使用Z或V系列示波器内部的PCIe一致性测试软件N5393F,支持U.2 End Point测试模式,实现U.2参数的自动化一致性测试。

 

 

>>> PCIe和NVMe协议测试

U4301B协议分析仪平台,支持PCIe3.0协议解析,支持LTSSM状态机分析,解析EQ链路协商的过程;并且支持NVMe,AHCI等事物层的解码;统计PCIe总线的性能分析。这个分析平台可以支持标准PCIe x 1到 x 16插槽,也支持焊接方式,以及M.2和U.2接口卡的探测。

 

 

 

 

另外,是德科技的U4305B PCIe训练器可以模拟PCIe3.0的主设备或从设备,训练对端被测件,可以进行LTSSM测试,完成PCIe3.0官方的协议一致性测试。另外,针对NVMe,U4305B可以模拟NVMe主设备,产生NVMe会话,发送NVMe命令,与被测件通信,完成NVMe的一致性测试。是德科技也提供PCIe备板设备N5316A,将U4305B和被测件NVMeSSD插卡都插在备板上实现相关的测试。

 

 

 

>>> SAS TX/RX 测试方案

M8020A可以配置两通道码型发生功能,在Tx测试时可以使用双通道合路产生OOB信号, Rx测试内置ISI可以模拟规范要求的外部ISI损耗要求,并且利用第二通道产生SAS要求的串扰信号。

 

 

>>> SATA TX/RX测试方案

下图简化的Tx测试可以强制DUT发送指定的测试码型,也可以利用M8020A误码仪作为BIST信号发生器,训练DUT进入环回并发射指定测试码型,完成自动化的测试。

 

 

>>> USB3.1/3.2测试方案

这里展示了越来越普及的Type C接口方式,USB3.1Tx/Rx测试方案,其中N7015A是Type C接口测试夹具,N7018A夹具支持PD和AltMode,并且支持USB3.1 SCD和LBPM的LFPS信号的生成和握手,完成Tx的参数测试。对于Rx测试,M8020A内置ISI功能,可以模拟USB协会规范定义的传输参考通道的插损模型,实现精简连接环境下的Rx接收容忍度测量,并且M8020A也支持CTS中要求的LFPSRx容忍度测量。

 

转载于:https://www.cnblogs.com/shaobojiao/p/7885542.html

<think>嗯,用户这次想了解SRAMMemoryCompilerIP的架构组成。从对话历史来看,用户之前询问过SRAM控制器的实现细节,还提供了几篇技术引用,说明可能是数字芯片设计工程师或研究生,正在做存储子系统相关的开发。用户提供的引用材料里,[1]提到了SRAM控制器分成AHB接口和sram_core两部分,[2]提到了性能分析指标,[3]涉及内存分配,[4]则是体系结构基础知识。这些其实和MemoryCompiler都有隐含关联——用户真正想知道的可能是:如何用MemoryCompiler生成的SRAM配合控制器工作,以及架构选择对性能的影响。需要特别注意术语准确性。比如"bank"在Compiler里指物理存储阵列,但用户引用的controller模块里"bank"可能指逻辑分区。在解释Bank算法时会特别说明这点。另外用户引用[2]提到的带宽/能耗指标很专业,回复时要结合Compiler的配置参数展开。用户没问但可能关心的隐藏问题:Compiler和标准单元库的工艺关联性、不同工艺节点的架构差异、测试电路集成方式。这些在"相关扩展"部分点到为止比较合适,避免信息过载。技术回复要点:-分六个核心模块说明,用户引用[1]的sram_core其实对应Compiler生成的阵列模块-强调编译器不是简单组合电路,而是工艺相关的拓扑生成器-功耗环需要结合用户引用的Amdahl定律——说明Compiler如何优化Active/Idle比-DFT模块要呼应引用[2]的性能追踪需求最后保持学术严谨性。比如深亚微米下的bitcell干扰效应需要提到,但不说太细;NVM选项属于前瞻技术,仅作提示。</think> 以下是SRAM Memory Compiler IP的架构组成详解,结合其核心模块和工作流程进行说明: --- ### **一、SRAM Memory Compiler IP 核心架构** SRAM Memory Compiler是自动化生成定制化SRAM模块的工具,其架构包含以下核心模块: #### **1. 存储阵列生成器(Memory Array Generator)** - **功能**:根据用户配置(容量、位宽、工艺节点)自动生成物理存储阵列(Bitcell Array)。 - **核心组件**: - **Bitcell 布局**:定制化的6T/8T/10T存储单元结构(6T为主流)。 - **行/列译码器**:动态生成行地址译码器(Row Decoder)和列多路选择器(Column MUX)[^1]。 - **位线结构**:差分位线(BL/BLB)和灵敏放大器(Sense Amplifier)集成。 #### **2. 外围电路引擎(Peripheral Circuit Engine)** - **关键电路模块**: - **预充电电路**:位线预充电与均衡控制。 - **写入驱动器**:支持高速写入的电流驱动电路。 - **时序控制器**:生成时钟门控(Clock Gating)和读写时序链(Timing Chain)[^2]。 #### **3. 接口适配层(Interface Adaptation Layer)** - **功能**:对接不同总线协议(如AHB、APB、AXI): - **协议转换逻辑**:将总线信号(haddr, hwrite, hsel)转换为SRAM内部控制信号(cs, we, oe)[^1]。 - **地址映射模块**:处理地址偏移(Bank选择、子阵列使能)。 #### **4. 可测性设计模块(DFT - Design for Test)** - **内置测试电路**: - **BIST(内建自测试)**:自动生成测试序列(March C算法)。 - **冗余修复电路**:通过激光熔丝(eFuse)替换故障存储单元[^2]。 #### **5. 功耗管理单元(Power Management Unit)** - **能效优化**: - **电压域划分**:独立电源域支持关断(Power Gating)。 - **漏电控制**:睡眠模式下切断非活跃存储单元的供电[^4]。 #### **6. 时序/功耗模型库(Timing/Power Characterization)** - **输出模型**: - **.lib 文件**:提供工艺角(TT/FF/SS)下的时序约束。 - **功耗报告**:动态功耗(Dynamic Power)和漏电功耗(Leakage Power)的周期级分析[^2]。 --- ### **二、SRAM Compiler 工作流程** ```mermaid graph TD A[用户输入] -->|容量/位宽/工艺| B(存储阵列生成) B --> C[生成Bitcell阵列] C --> D[外围电路合成] D --> E[接口协议适配] E --> F[DFT电路插入] F --> G[功耗管理集成] G --> H[生成GDSII/.lib/Verilog] ``` 1. **输入配置阶段** 用户定义SRAM规格(如32Kx8 bit@28nm),Compiler自动选择最优Bank划分(如4个8Kx8 Bank)。 2. **物理实现阶段** - Bitcell阵列采用**倾斜布局(Tilted Cell)** 减小面积。 - 灵敏放大器采用**电流锁存结构**提升读取速度[^2]。 3. **接口集成示例** 以AHB总线接口为例: ```verilog // AHB信号转SRAM控制 assign sram_cs = hsel & hready; assign sram_we = hwrite & sram_cs; assign bank_sel = haddr[12:11]; // Bank选择 ``` --- ### **三、关键设计挑战与优化** 1. **稳定性 vs 速度** 深亚微米工艺下: - **Bitcell 稳定性**:提升PMOS强度抵抗噪声干扰。 - **读写冲突**:通过**半行选(Half-Selected)** 抑制单元扰动[^2]。 2. **工艺相关性** 不同节点(如28nm vs 7nm)需调整: - **FinFET Bitcell**:三维结构优化漏电控制。 - **辅助电路**:自适应时序补偿(Process Monitor)。 --- ### **四、典型输出交付物** | **交付内容** | **格式** | **用途** | |---------------------|----------------|---------------------------| | 物理版图 | GDSII/OASIS | 芯片流片 | | 时序模型 | .lib (Liberty) | 综合与静态时序分析 | | 功耗模型 | VCD/SAIF | 功耗分析 | | 可测性电路 | Verilog+Testbench | 量产测试 | | 硅验证报告 | PDF | 特性参数(频率/眼图)[^2] | --- ### **扩展说明** - **先进工艺支持**:22nm以下节点可能集成**非易失性选项(NVM Hybrid)**。 - **AI加速优化**:面向ML的Compiler支持**权重固定架构(Fixed-Weight)** 提升能效。 如需特定工艺(如TSMC 7nm)的实现细节或DFT方案,可进一步探讨。 --- **相关问题** 1. SRAM Memory Compiler 在先进工艺(7nm以下)面临哪些物理设计挑战? 2. 如何验证Compiler生成的SRAM模块时序一致性? 3. SRAM Compiler的DFT方案如何平衡测试覆盖率和面积开销? 4. 与传统手动设计相比,Compiler生成SRAM的PPA(Power/Performance/Area)优化空间多大? 5. AI场景中SRAM Compiler需要哪些特殊优化? [^1]: AHB-SRAM控制器模块划分逻辑 [^2]: SRAM性能与测试指标详解 [^3]: 内存地址空间规划方法 [^4]: 能效优化的理论基础(Amdahl's Law)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值