引用
green-waste 的 【简介】如何编写linux下nand flash驱动-2
【简介】如何编写linux 下nand flash 驱动-2
version: 1.0
date:20090721
Author :crifan
Mail:green-waste(At)163.com
上接:【简介】如何编写linux下nand flash驱动-1
http://green-waste.blog.163.com/blog/static/3267767820096221127554/
【读( read )操作过程详解】
以最简单的 read 操作为例,解释如何理解时序图,以及将时序图
中的要求,转化为代码。
解释时序图之前,让我们先要搞清楚,我们要做的事情:那就是,要从 nand flash 的 某个页里面,读取我们要的数据。
要实现此功能,会涉及到几部分的知识,至少很容易想到的就是:需要用到哪些命令,怎么发这些命令,怎么计算所需要的地址,怎么读取我们要的数据等等。
下面,就一步步的解释,需要做什么,以及如何去做:
1. 需要使用何种命令
首先,是要了解,对于读取数据,要用什么命令。
下面是 datasheet 中的命令集合:
![]()
图 5.Nand Flash K9K8G08U0A 的命令集合
很容易看出,我们要读取数据,要用到 Read 命令,该命令需要 2 个周期,第一个周期发 0x00 ,第二个周期发 0x30 。
2. 发送命令前的准备工作以及时序图各个信号的具体含义
知道了用何命令后,再去了解如何发送这些命令。
[ 小常识 ]
在开始解释前,多罗嗦一下 ” 使能 ” 这个词,以便有些读者和我以前一样,在听这类虽然对于某些专业人士说是属于最基本的词汇了,但是对于初次接触,或者接触不多的人来说,听多了,容易被搞得一头雾水:使能( Enable ),是指使其(某个信号)有效,使其生效的意思,“使其”“能够”怎么怎么样。。。。比如,上面图中的 CLE 线号,是高电平有效,如果此时将其设为高电平,我们就叫做,将 CLE 使能,也就是使其生效的意思。
![]()
图 6.Nand Flash 数据读取操作的时序图
注:此图来自三星的型号 K9K8G08U0A 的 nand flash 的数据手册 (datasheet) 。
我们来一起看看,我在图 6 中的特意标注的①边上的黄色竖线。
黄色竖线所处的时刻,是在发送读操作的第一个周期的命令 0x00 之前的那一刻。
让我们看看,在那一刻,其所穿过好几行都对应什么值,以及进一步理解,为何要那个值。
( 1 )黄色竖线穿过的第一行,是 CLE 。还记得前面介绍命令所存使能( CLE )那个引脚吧? CLE ,将 CLE 置 1 ,就说明你将要通过 I/O 复用端口发送进入 Nand Flash 的,是命令,而不是地址或者其他类型的数据。只有这样将 CLE 置 1 ,使其有效,才能去通知了内部硬件逻辑,你接下来将收到的是命令,内部硬件逻辑,才会将受到的命令,放到命令寄存器中,才能实现后面正确的操作,否则,不去将 CLE 置 1 使其有效,硬件会无所适从,不知道你传入的到底是数据还是命令了。
( 2 )而第二行,是 CE# ,那一刻的值是 0 。这个道理很简单,你既然要向 Nand Flash 发命令,那么先要选中它,所以,要保证 CE# 为低电平,使其有效,也就是片选有效。
( 3 )第三行是 WE# ,意思是写使能。因为接下来是往 nand Flash 里面写命令,所以,要使得 WE# 有效,所以设为低电平。
( 4 )第四行,是 ALE 是低电平,而 ALE 是高电平有效,此时意思就是使其无效。而对应地,前面介绍的,使 CLE 有效,因为将要数据的是命令,而不是地址。如果在其他某些场合,比如接下来的要输入地址的时候,就要使其有效,而使 CLE 无效了。
( 5 )第五行, RE# ,此时是高电平,无效。可以看到,知道后面低 6 阶段,才变成低电平,才有效,因为那时候,要发生读取命令,去读取数据。
( 6 )第六行,就是我们重点要介绍的,复用的输入输出 I/O 端口了,此刻,还没有输入数据,接下来,在不同的阶段,会输入或输出不同的数据 / 地址。
( 7 )第七行, R/B#, 高电平,表示 R ( Ready ) / 就绪,因为到了后面的第 5 阶段,硬件内部,在第四阶段,接受了外界的读取命令后,把该页的数据一点点送到页寄存器中,这段时间,属于系统在忙着干活,属于忙的阶段,所以, R/B# 才变成低,表示 Busy 忙的状态的。
介绍了时刻①的各个信号的值,以及为何是这个值之后,相信,后面的各个时刻,对应的不同信号的各个值,大家就会自己慢慢分析了,也就容易理解具体的操作顺序和原理了。
3. 如何计算出,我们要传入的地址
在介绍具体读取数据的详细流程之前,还要做一件事,那就是,先要搞懂我们要访问的地址,以及这些地址,如何分解后,一点点传入进去,使得硬件能识别才行。
此处还是以 K9K8G08U0A 为例,此 nand flash ,一共有 8192 个块,每个块内有 64 页,每个页是 2K+64 Bytes ,假设,我们要访问其中的第 7000 个块中的第 25 页中的 1208 字节处的地址,此时,我们就要先把具体的地址算出来:
物理地址 = 块大小×块号 + 页大小×页号 + 页内地址 =7000 × 128K+64 × 2K+1208=0x36B204B8, 接下来,我们就看看,怎么才能把这个实际的物理地址,转化为 nand Flash 所要求的格式。
在解释地址组成之前,先要来看看其 datasheet 中关于地址周期的介绍:
![]()
图 7 Nand Flash 的地址周期组成
结合图 7 和图 5 中的 2 , 3 阶段,我们可以看出,此 nand flash 地址周期共有 5 个, 2 个列 (Column) 周期, 3 个行( Row )周期。而对于对应地,我们可以看出,实际上,列地址 A0~A10 ,就是页内地址,地址范围是从 0 到 2047 ,而对出的 A11 ,理论上可以表示 2048 ~ 4095 ,但是实际上,我们最多也只用到了 2048 ~ 2011 ,用于表示页内的 oob 区域,其大小是 64 字节。
对应地, A12 ~ A30 ,称作页号,页的号码,可以定位到具体是哪一个页。而其中, A18 ~ A30 ,表示对应的块号,即属于哪个块。
简单解释完了地址组成,那么就很容易分析上面例子中的地址了:
0x36B204B8 = 0011 0110 1011 0010 0000 0100 1011 1000 ,分别分配到 5 个地址周期就是:
1st 周期, A7 ~ A0 : 1011 1000 = 0x B8
2nd 周期, A11 ~ A8 : 0000 0100 = 0x04
3rd 周期, A19 ~ A12 : 0010 0000 = 0x20
4th 周期, A27 ~ A20 : 0110 1011 = 0x6B
5th 周期, A30 ~ A28 : 0000 0011 = 0x03
注意,与图 7 中对应的, *L ,意思是地电平,由于未用到那些位, datasheet 中强制要求设为 0 ,所以,才有上面的 2nd 周期中的高 4 位是 0000. 其他的 A30 之后的位也是类似原理,都是 0 。
因此,接下来要介绍的,我们要访问第 7000 个块中的第 25 页中的 1208 字节处的话,所要传入的地址就是分 5 个周期,分别传入两个列地址的: 0xB8 , 0x04 ,然后再传 3 个行地址的: 0x20 , 0x6B , 0x03 ,这样硬件才能识别。
4. 读操作过程的解释
准备工作终于完了,下面就可以开始解释说明,对于读操作的,上面图中标出来的, 1-6 个阶段,具体是什么含义。
(1) 操作准备阶段:此处是读( Read )操作,所以,先发一个图 5 中读命令的第一个阶段的 0x00, 表示,让硬件先准备一下,接下来的操作是读。
(2) 发送两个周期的列地址。也就是页内地址,表示,我要从一个页的什么位置开始读取数据。
(3) 接下来再传入三个行地址。对应的也就是页号。
(4) 然后再发一个读操作的第二个周期的命令 0x30 。接下来,就是硬件内部自己的事情了。
(5) Nand Flash 内部硬件逻辑,负责去按照你的要求,根据传入的地址,找到哪个块中的哪个页,然后把整个这一页的数据,都一点点搬运到页缓存中去。而在此期间,你所能做的事,也就只需要去读取状态寄存器,看看对应的位的值,也就是 R/B# 那一位,是 1 还是 0 , 0 的话,就表示,系统是 busy ,仍在 ” 忙“(着读取数据),如果是 1 ,就说系统活干完了,忙清了,已经把整个页的数据都搬运到页缓存里去了,你可以接下来读取你要的数据了。
对于这里。估计有人会问了,这一个页一共 2048+64 字节,如果我传入的页内地址,就像上面给的 1208 一类的值,只是想读取 1028 到 2011 这部分数据,而不是页开始的 0 地址整个页的数据,那么内部硬件却读取整个页的数据出来,岂不是很浪费吗?答案是,的确很浪费,效率看起来不高,但是实际就是这么做的,而且本身读取整个页的数据,相对时间并不长,而且读出来之后,内部数据指针会定位到你刚才所制定的 1208 的那个位置。
(6) 接下来,就是你“窃取“系统忙了半天之后的劳动成果的时候了,呵呵。通过先去 Nand Flash 的控制器中的数据寄存器中写入你要读取多少个字节 (byte)/ 字 (word) ,然后就可以去 Nand Flash 的控制器的 FIFO 中,一点点读取你要的数据了。
至此,整个 Nand Flash 的读操作就完成了。
对于其他操作,可以根据我上面的分析,一点点自己去看 datasheet ,根据里面的时序图去分析具体的操作过程,然后对照代码,会更加清楚具体是如何实现的。
【 Flash 的类型】
Flash 的类型主要分两种, nand flash 和 nor flash 。
除了网上最流行的这个解释之外:
再多说几句:
1.nor 的成本相对高,具体读写数据时候,不容易出错。总体上,比较适合应用于存储少量的代码。
2.Nand flash 相对成本低。使用中数据读写容易出错,所以一般都需要有对应的软件或者硬件的数据校验算法,统称为 ECC 。由于相对来说,容量大,价格便宜,因此适合用来存储大量的数据。其在嵌入式系统中的作用,相当于 PC 上的硬盘,用于存储大量数据。
所以,一个常见的应用组合就是,用小容量的 Nor Flash 存储启动代码,比如 uboot ,系统启动后 , 初始化对应的硬件,包括 SDRAM 等,然后将 Nand Flash 上的 Linux 内核读取到内存中,做好该做的事情后,就跳转到 SDRAM 中去执行内核了,然后内核解压(如果是压缩内核的话,否则就直接运行了)后,开始运行,在 Linux 内核启动最后,去 Nand Flash 上,挂载根文件,比如 jffs2 , yaffs2 等,挂载完成,运行初始化脚本,启动 consle 交互,才运行你通过 console 和内核交互。至此完成整个系统启动过程。
而 Nor Flash 就分别存放的是 Uboot , Nand Flash 存放的是 Linux 的内核镜像和根文件系统,以及余下的空间分成一个数据区。
Nor flash ,有类似于 dram 之类的地址总线,因此可以直接和 CPU 相连, CPU 可以直接通过地址总线对 nor flash 进行访问,而 nand flash 没有这类的总线,只有 IO 接口,只能通过 IO 接口发送命令和地址,对 nand flash 内部数据进行访问。相比之下, nor flash 就像是并行访问, nand flash 就是串行访问,所以相对来说,前者的速度更快些。
但是由于物理制程 / 制造方面的原因,导致 nor 和 nand 在一些具体操作方面的特性不同:
NOR
NAND
(备注)
接口
总线
I/O 接口
这个两者最大的区别
单个 cell 大小
大
小
单个 Cell 成本
高
低
读耗时
快
慢
单字节的编程时间
快
慢
多字节的编程时间
慢
快
擦除时间
慢
快
功耗
高
低,但是需要额外的 RAM
是否可以执行代码
是
不行 , 但是一些新的芯片,可以在第一页之外执行一些小的 loader ( 1 )
即是否允许,芯片内执行 (XIP, eXecute In Place) (2)
位反转 (Bit twiddling/bit flip)
几乎无限制
1-4 次,也称作 “部分页编程限制”
也就是数据错误, 0->1 或 1->0
在芯片出厂时候是否允许坏块
不允许
允许
表 3 Nand Flash 和 Nor Flash 的区别
1. 理论上是可以的,而且也是有人验证过可以的,只不过由于 nand flash 的物理特性,不能完全保证所读取的数据 / 代码是正确的,实际上,很少这么用而已。因为,如果真是要用到 nand flash 做 XIP ,那么除了读出速度慢之外,还要保证有数据的校验,以保证读出来的,将要执行的代码 / 数据,是正确的。否则,系统很容易就跑飞了。。。
2. 芯片内执行 (XIP, eXecute In Place) :
http://hi.baidu.com/serial_story/blog/item/adb20a2a3f8ffe3c5243c1df.html
【 Nand Flash 的种类】
具体再分,又可以分为
1)Bare NAND chips :裸片,单独的 nand 芯片
2)SmartMediaCards : = 裸片 + 一层薄塑料,常用于数码相机和 MP3 播放器中。之所以称 smart ,是由于其软件 smart ,而不是硬件本身有啥 smart 之处。 ^_^
3)DiskOnChip :裸片 +glue logic , glue logic= 硬件 ECC 产生器 + 用于静态的 nand 芯片控制的寄存器 + 直接访问一小片地址窗口,那块地址中包含了引导代码的 stub 桩,其可以从 nand flash 中拷贝真正的引导代码。
【 spare area/oob 】
Nand 由于最初硬件设计时候考虑到,额外的错误校验等需要空间,专门对应每个页,额外设计了叫做 spare area 空区域,在其他地方,比如 jffs2 文件系统中,也叫做 oob ( out of band )数据。
其具体用途,总结起来有:
1. 标记是否是坏快
2. 存储 ECC 数据
3. 存储一些和文件系统相关的数据,如 jffs2 就会用到这些空间存储一些特定信息, yaffs2 文件系统,会在 oob 中,存放很多和自己文件系统相关的信息。
2. 软件方面
如果想要在 Linux 下编写 Nand Flash 驱动,那么就先要搞清楚 Linux 下,关于此部分的整个框架。弄明白,系统是如何管理你的 nand flash 的,以及,系统都帮你做了那些准备工作,而剩下的,驱动底层实现部分,你要去实现哪些功能,才能使得硬件正常工作起来。
【内存技术设备, MTD ( Memory Technology Device )】
MTD ,是 Linux 的存储设备中的一个子系统。其设计此系统的目的是,对于内存类的设备,提供一个抽象层,一个接口,使得对于硬件驱动设计者来说,可以尽量少的去关心存储格式,比如 FTL , FFS2 等,而只需要去提供最简单的底层硬件设备的读 / 写 / 擦除函数就可以了。而对于数据对于上层使用者来说是如何表示的,硬件驱动设计者可以不关心,而 MTD 存储设备子系统都帮你做好了。
对于 MTD 字系统的好处,简单解释就是,他帮助你实现了,很多对于以前或者其他系统来说,本来也是你驱动设计者要去实现的很多功能。换句话说,有了 MTD ,使得你设计 Nand Flash 的驱动,所要做的事情,要少很多很多,因为大部分工作,都由 MTD 帮你做好了。
当然,这个好处的一个“副作用”就是,使得我们不了解的人去理解整个 Linux 驱动架构,以及 MTD ,变得更加复杂。但是,总的说,觉得是利远远大于弊,否则,就不仅需要你理解,而且还是做更多的工作,实现更多的功能了。
此外,还有一个重要的原因,那就是,前面提到的 nand flash 和普通硬盘等设备的特殊性:
有限的通过出复用来实现输入输出命令和地址 / 数据等的 IO 接口,最小单位是页而不是常见的 bit ,写前需擦除等,导致了这类设备,不能像平常对待硬盘等操作一样去操作,只能采取一些特殊方法,这就诞生了 MTD 设备的统一抽象层。
MTD ,将 nand flash , nor flash 和其他类型的 flash 等设备,统一抽象成 MTD 设备来管理,根据这些设备的特点,上层实现了常见的操作函数封装,底层具体的内部实现,就需要驱动设计者自己来实现了。具体的内部硬件设备的读 / 写 / 擦除函数,那就是你必须实现的了。
HARD drives
MTD device
连续的扇区
连续的可擦除块
扇区都很小 (512B,1024B)
可擦除块比较大 (32KB,128KB)
主要通过两个操作对其维护操作:读扇区,写扇区
主要通过三个操作对其维护操作:从擦除块中读,写入擦除块,擦写可擦除块
坏快被重新映射,并且被硬件隐藏起来了(至少是在如今常见的 LBA 硬盘设备中是如此)
坏的可擦除块没有被隐藏,软件中要处理对应的坏块问题。
HDD 扇区没有擦写寿命超出的问题。
可擦除块是有擦除次数限制的,大概是 104-105 次 .
表 4.MTD 设备和硬盘设备之间的区别
多说一句,关于 MTD 更多的内容,感兴趣的,去附录中的 MTD 的主页去看。
关于 mtd 设备驱动,感兴趣的可以去参考
那里,算是比较详细地介绍了整个流程,方便大家理解整个 mtd 框架和 nand flash 驱动。
【 Nand flash 驱动工作原理】
在介绍具体如何写 Nand Flash 驱动之前,我们先要了解,大概的,整个系统,和 Nand Flash 相关的部分的驱动工作流程,这样,对于后面的驱动实现,才能更加清楚机制,才更容易实现,否则就是,即使写完了代码,也还是没搞懂系统是如何工作的了。
让我们以最常见的, Linux 内核中已经有的三星的 Nand Flash 驱动,来解释 Nand Flash 驱动具体流程和原理。
此处是参考 2.6.29 版本的 Linux 源码中的 /drivers/mtd/nand/s3c2410.c ,以 2410 为例。
1. 在 nand flash 驱动加载后,第一步,就是去调用对应的 init 函数, s3c2410_nand_init, 去将在 nand flash 驱动注册到 Linux 驱动框架中。
2. 驱动本身,真正开始,是从 probe 函数, s3c2410_nand_probe->s3c24xx_nand_probe,
在 probe 过程中,去用 clk_enable 打开 nand flash 控制器的 clock 时钟,用 request_mem_region 去申请驱动所需要的一些内存等相关资源。然后,在 s3c2410_nand_inithw 中,去初始化硬件相关的部分,主要是关于时钟频率的计算,以及启用 nand flash 控制器,使得硬件初始化好了,后面才能正常工作。
3. 需要多解释一下的,是这部分代码:
for (setno = 0; setno < nr_sets; setno++, nmtd++) {
pr_debug("initialising set %d (%p, info %p)/n", setno, nmtd, info);
/* 调用 init chip 去挂载你的 nand 驱动的底层函数到 nand flash 的结构体中,以及设置对应的 ecc mode ,挂载 ecc 相关的函数 */
s3c2410_nand_init_chip(info, nmtd, sets);
/* scan_ident ,扫描 nand 设备,设置 nand flash 的默认函数,获得物理设备的具体型号以及对应各个特性参数,这部分算出来的一些值,对于 nand flash 来说,是最主要的参数,比如 nand falsh 的芯片的大小,块大小,页大小等。 */
nmtd->scan_res = nand_scan_ident(&nmtd->mtd,
(sets) ? sets->nr_chips : 1);
if (nmtd->scan_res == 0) {
s3c2410_nand_update_chip(info, nmtd);
/* scan tail ,从名字就可以看出来,是扫描的后一阶段,此时,经过前面的 scan_ident ,我们已经获得对应 nand flash 的硬件的各个参数,然后就可以在 scan tail 中,根据这些参数,去设置其他一些重要参数,尤其是 ecc 的 layout ,即 ecc 是如何在 oob 中摆放的,最后,再去进行一些初始化操作,主要是根据你的驱动,如果没有实现一些函数的话,那么就用系统默认的。 */
nand_scan_tail(&nmtd->mtd);
/* add partion ,根据你的 nand flash 的分区设置,去分区 */
s3c2410_nand_add_partition(info, nmtd, sets);
}
if (sets != NULL)
sets++;
}
4. 等所有的参数都计算好了,函数都挂载完毕,系统就可以正常工作了。
上层访问你的 nand falsh 中的数据的时候,通过 MTD 层,一层层调用,最后调用到你所实现的那些底层访问硬件数据 / 缓存的函数中。
【 Linux 下 nand flash 驱动编写步骤简介】
关于上面提到的,在 nand_scan_tail 的时候,系统会根据你的驱动,如果没有实现一些函数的话,那么就用系统默认的。如果实现了自己的函数,就用你的。
估计很多人就会问了,那么到底我要实现哪些函数呢,而又有哪些是可以不实现,用系统默认的就可以了呢。
此问题的,就是我们下面要介绍的,也就是,你要实现的,你的驱动最少要做哪些工作,才能使整个 nand flash 工作起来。
1. 对于驱动框架部分
其实,要了解,关于驱动框架部分,你所要做的事情的话,只要看看三星的整个 nand flash 驱动中的这个结构体,就差不多了:
static struct platform_driver s3c2410_nand_driver = {
.probe = s3c2410_nand_probe,
.remove = s3c2410_nand_remove,
.suspend = s3c24xx_nand_suspend,
.resume = s3c24xx_nand_resume,
.driver = {
.name = "s3c2410-nand",
.owner = THIS_MODULE,
},
};
对于上面这个结构体,没多少要解释的。从名字,就能看出来:
( 1 ) probe 就是系统“探测”,就是前面解释的整个过程,这个过程中的多数步骤,都是和你自己的 nand flash 相关的,尤其是那些硬件初始化部分,是你必须要自己实现的。
( 2 ) remove ,就是和 probe 对应的,“反初始化”相关的动作。主要是释放系统相关资源和关闭硬件的时钟等常见操作了。
(3)suspend 和 resume ,对于很多没用到电源管理的情况下,至少对于我们刚开始写基本的驱动的时候,可以不用关心,放个空函数即可。
2. 对于 nand flash 底层操作实现部分
而对于底层硬件操作的有些函数,总体上说,都可以在上面提到的 s3c2410_nand_init_chip 中找到:
static void s3c2410_nand_init_chip(struct s3c2410_nand_info *info,
struct s3c2410_nand_mtd *nmtd,
struct s3c2410_nand_set *set)
{
struct nand_chip *chip = &nmtd->chip;
void __iomem *regs = info->regs;
chip->write_buf = s3c2410_nand_write_buf ;
chip->read_buf = s3c2410_nand_read_buf ;
chip->select_chip = s3c2410_nand_select_chip ;
chip->chip_delay = 50;
chip->priv = nmtd;
chip->options = 0;
chip->controller = &info->controller;
switch (info->cpu_type) {
case TYPE_S3C2410:
/* nand flash 控制器中,一般都有对应的数据寄存器,用于给你往里面写数据,表示将要读取或写入多少个字节 (byte,u8)/ 字 (word,u32) ,所以,此处,你要给出地址,以便后面的操作所使用 */
chip->IO_ADDR_W = regs + S3C2410_NFDATA;
info->sel_reg = regs + S3C2410_NFCONF;
info->sel_bit = S3C2410_NFCONF_nFCE;
chip->cmd_ctrl = s3c2410_nand_hwcontrol ;
chip->dev_ready = s3c2410_nand_devready ;
break;
。。。。。。
}
chip->IO_ADDR_R = chip->IO_ADDR_W;
nmtd->info = info;
nmtd->mtd.priv = chip;
nmtd->mtd.owner = THIS_MODULE;
nmtd->set = set;
if (hardware_ecc) {
chip->ecc.calculate = s3c2410_nand_calculate_ecc ;
chip->ecc.correct = s3c2410_nand_correct_data ;
/* 此处,多数情况下,你所用的 Nand Flash 的控制器,都是支持硬件 ECC 的,所以,此处设置硬件 ECC(HW_ECC) ,也是充分利用硬件的特性,而如果此处不用硬件去做的 ECC 的话,那么下面也会去设置成 NAND_ECC_SOFT ,系统会用默认的软件去做 ECC 校验,相比之下,比硬件 ECC 的效率就低很多,而你的 nand flash 的读写,也会相应地要慢不少 */
chip->ecc.mode = NAND_ECC_HW;
switch (info->cpu_type) {
case TYPE_S3C2410:
chip->ecc.hwctl = s3c2410_nand_enable_hwecc ;
chip->ecc.calculate = s3c2410_nand_calculate_ecc;
break;
。。。。。
}
} else {
chip->ecc.mode = NAND_ECC_SOFT;
}
if (set->ecc_layout != NULL)
chip->ecc.layout = set->ecc_layout;
if (set->disable_ecc)
chip->ecc.mode = NAND_ECC_NONE;
}
而我们要实现的底层函数,也就是上面蓝色标出来的一些函数而已:
( 1 ) s3c2410_nand_write_buf 和 s3c2410_nand_read_buf :这是两个最基本的操作函数,其功能,就是往你的 nand flash 的控制器中的 FIFO 读写数据。一般情况下,是 MTD 上层的操作,比如要读取一页的数据,那么在发送完相关的读命令和等待时间之后,就会调用到你底层的 read_buf ,去 nand Flash 的 FIFO 中,一点点把我们要的数据,读取出来,放到我们制定的内存的缓存中去。写操作也是类似,将我们内存中的数据,写到 Nand Flash 的 FIFO 中去。具体的数据流向,参考上面的图 4 。
( 2 ) s3c2410_nand_select_chip : 实现 Nand Flash 的片选。
( 3 ) s3c2410_nand_hwcontrol :给底层发送命令或地址,或者设置具体操作的模式,都是通过此函数。
( 4 ) s3c2410_nand_devready : Nand Flash 的 一些操作,比如读一页数据,写入(编程)一页数据,擦除一个块,都是需要一定时间的,在命发送完成后,就是硬件开始忙着工作的时候了,而硬件什么时候完成 这些操作,什么时候不忙了,变就绪了,就是通过这个函数去检查状态的。一般具体实现都是去读硬件的一个状态寄存器,其中某一位是否是 1 ,对应着是出于“就绪 / 不忙”还是“忙”的状态。这个寄存器,也就是我们前面分析时序图中的 R/B# 。
( 5 ) s3c2410_nand_enable_hwecc : 在硬件支持的前提下,前面设置了硬件 ECC 的话,要实现这个函数,用于每次在读写操作前,通过设置对应的硬件寄存器的某些位,使得启用硬件 ECC ,这样在读写操作完成后,就可以去读取硬件校验产生出来的 ECC 数值了。
( 6 ) s3c2410_nand_calculate_ecc :如果是上面提到的硬件 ECC 的话,就不用我们用软件去实现校验算法了,而是直接去读取硬件产生的 ECC 数值就可以了。
( 7 ) s3c2410_nand_correct_data :当实际操作过程中,读取出来的数据所对应的硬件或软件计算出来的 ECC ,和从 oob 中读出来的 ECC 不一样的时候,就是说明数据有误了,就需要调用此函数去纠正错误。对于现在 SLC 常见的 ECC 算法来说,可以发现 2 位,纠正 1 位。如果错误大于 1 位,那么就无法纠正回来了。一般情况下,出错超过 1 位的,好像几率不大。至少我看到的不是很大。更复杂的情况和更加注重数据安全的情况下,一般是需要另外实现更高效和检错和纠错能力更强的 ECC 算法的。
当然,除了这些你必须实现的函数之外,在你更加熟悉整个框架之后,你可以根据你自己的 nand flash 的特点,去实现其他一些原先用系统默认但是效率不高的函数,而用自己的更高效率的函数替代他们,以提升你的 nand flash 的整体性能和效率。
【引用文章】
http://hi.baidu.com/serial_story/blog/item/3f1635d1dc041cd7562c84a1.html
2. Samsung 的型号为 K9G8G08U0M 的 Nand Flash 的数据手册
要下载数据手册,可以去这里介绍的网站下载:
samsung 4K pagesize SLC Nand Flash K9F8G08U0M datasheet + 推荐一个 datasheet 搜索的网站
http://hi.baidu.com/serial_story/blog/item/7f25a03def1de309bba167c8.html
http://hi.baidu.com/serial_story/blog/item/f06db3546eced11a3b29356c.html
4. Memory Technology Device (MTD) Subsystem for Linux.