nand flash坏块管理OOB,BBT,ECC

0.NAND的操作管理方式

     NAND FLASH的管理方式:以三星FLAHS为例,一片Nand flash为一个设备(device),1 (Device) = xxxx (Blocks),1 (Block) = xxxx (Pages),1(Page) =528 (Bytes) = 数据块大小(512Bytes) + OOB 块大小(16Bytes,除OOB第六字节外,通常至少把OOB的前3个字节存放Nand Flash硬件ECC码)。

 1.为什么会出现坏块
    由于NAND Flash的工艺不能保证NAND的Memory Array在其生命周期中保持性能的可靠,因此,在NAND的生产中及使用过程中会产生坏块。坏块的特性是:当编程/擦除这个块时,会造成Page Program和Block Erase操作时的错误,相应地反映到Status Register的相应位。

2.坏块的分类
   总体上,坏块可以分为两大类:(1)固有坏块:这是生产过程中产生的坏块,一般芯片原厂都会在出厂时都会将每个坏块第一个page的spare area的第6个byte标记为不等于0xff的值。(2)使用坏块:这是在NAND Flash使用过程中,如果Block Erase或者Page Program错误,就可以简单地将这个块作为坏块来处理,这个时候需要把坏块标记起来。为了和固有坏块信息保持一致,将新发现的坏块的第一个page的 spare area的第6个Byte标记为非0xff的值。

3.坏块管理
    根据上面的这些叙述,可以了解NAND Flash出厂时在spare area中已经反映出了坏块信息,因此,如果在擦除一个块之前,一定要先check一下第一页的spare area的第6个byte是否是0xff,如果是就证明这是一个好块,可以擦除;如果是非0xff,那么就不能擦除,以免将坏块标记擦掉。当然,这样处理可能会犯一个错误―――“错杀伪坏块”,因为在芯片操作过程中可能由于电压不稳定等偶然因素会造成NAND操作的错误。但是,为了数据的可靠性及软件设计的简单化,还是需要遵照这个标准。

      可以用BBT:bad block table,即坏块表来进行管理。各家对nand的坏块管理方法都有差异。比如专门用nand做存储的,会把bbt放到block0,因为第0块一定是好的块。但是如果nand本身被用来boot,那么第0块就要存放程序,不能放bbt了。有的把bbt放到最后一块,当然,这一块坚决不能为坏块。bbt的大小跟nand大小有关,nand越大,需要的bbt也就越大。
4.坏块纠正

      ECC:NAND Flash出错的时候一般不会造成整个Block或是Page不能读取或是全部出错,而是整个Page(例如512Bytes)中只有一个或几个bit出错。一般使用一种比较专用的校验——ECC。ECC能纠正单比特错误和检测双比特错误,而且计算速度很快,但对1比特以上的错误无法纠正,对2比特以上的错误不保证能检测。
      ECC一般每256字节原始数据生成3字节ECC校验数据,这三字节共24比特分成两部分:6比特的列校验和16比特的行校验,多余的两个比特置1。(512生成两组ECC?)
      当往NAND Flash的page中写入数据的时候,每256字节我们生成一个ECC校验和,称之为原ECC校验和,保存到PAGE的OOB(out-of-band)数据区中。其位置就是eccpos[]。校验的时候,根据上述ECC生成原理不难推断:将从OOB区中读出的原ECC校验和新ECC校验和按位异或,若结果为0,则表示不存在错(或是出现了ECC无法检测的错误);若3个字节异或结果中存在11个比特位为1,表示存在一个比特错误,且可纠正;若3个字节异或结果中只存在1个比特位为1,表示OOB区出错;其他情况均表示出现了无法纠正的错误。
5.补充
  (1)需要对前面由于Page Program错误发现的坏块进行一下特别说明。如果在对一个块的某个page进行编程的时候发生了错误就要把这个块标记为坏块,首先就要把块里其他好的面的内容备份到另外一个空的好块里面,然后,把这个块标记为坏块。当然,这可能会犯“错杀”之误,一个补救的办法,就是在进行完块备份之后,再将这个坏块擦除一遍,如果Block Erase发生错误,那就证明这个块是个真正的坏块,那就毫不犹豫地将它打个“戳”吧!
  (2)可能有人会问,为什么要使用每个块第一页的spare area的第六个byte作为坏块标记。这是NAND Flash生产商的默认约定,你可以看到Samsung,Toshiba,STMicroelectronics都是使用这个Byte作为坏块标记的。

     (3)为什么好块用0xff来标记?因为Nand Flash的擦除即是将相应块的位全部变为1,写操作时只能把芯片每一位(bit)只能从1变为0,而不能从0变为1。0XFF这个值就是标识擦除成功,是好块。

 

本文来自优快云博客,转载请标明出处:http://blog.youkuaiyun.com/zhandoushi1982/archive/2009/09/28/4603443.aspx

### NAND FlashECCOOB 的概念及实现 #### 错误校正码 (ECC) 错误校正码用于检测并纠正数据读取过程中可能出现的位翻转错误。NAND Flash 存储介质容易受到物理损坏的影响,因此需要强大的纠错机制来确保数据可靠性。通常情况下,每512字节的数据会附加一定数量的ECC比特,在写入时计算这些额外的信息,并在读回时用来验证和修正可能存在的单一位错或其他少量错误[^2]。 为了适应不同应用场景的需求以及提高存储效率,现代 NAND 芯片支持多种 ECC 强度设置。随着技术进步,能够处理更多随机错误的新一代算法也被引入到 NAND 控制器中,比如 BCH 编码或者 LDPC(低密度奇偶校验)编码方案。 ```python # Python伪代码展示如何应用简单的汉明码作为ECC的一个例子 def calculate_hamming_code(data_bits): r = 0 while ((len(data_bits) + r + 1) >= pow(2, r)): r += 1 hamming_list = [None]*(len(data_bits)+r) j = 0 k = 1 for i in range(1,len(hamming_list)+1): if(i == pow(2,k-1)): hamming_list[i-1]= 'P'+str(k) k+=1 else: hamming_list[i-1]= data_bits[j] j+=1 parity_positions=[pow(2,x)-1 for x in range(r)] for p in parity_positions: positions_to_check=[i for i in range(len(hamming_list)) if((i+1)&p==p)] count=0 for pos in positions_to_check: if isinstance(hamming_list[pos], str) and not('P' in hamming_list[pos]): count=count^(ord(hamming_list[pos])-ord('0')) hamming_list[p]='P'+str(count%2) return ''.join([bit if type(bit)==str else chr(ord('0')+int(bit)) for bit in hamming_list]) ``` #### 带外区域 (OOB Area) 带外区域是指位于每个页面实际用户可访问地址空间之外的一小部分保留区。这部分主要用于保存元数据信息,如坏块标记、逻辑地址映射表项以及其他控制结构等重要参数。对于某些文件系统而言,OOB 还可以承载额外的功能特性,例如 JFFS2 文件系统的 Wear Leveling 数据记录就依赖于该区域完成。 当执行擦除操作之前,如果发现某个区块存在过多不可修复的错误,则会在相应的 OOB 区域中标记此区块为“坏”,从而防止后续对该位置继续进行编程或读取尝试。这种做法有助于维持整个设备长期稳定运行的同时减少因硬件缺陷带来的风险。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值