linux 0.11 内核学习 -- buffer.c

/*

* buffer.c 程序用于对高速缓冲区(池)进行操作和管理。高速缓冲

* 区位于内核代码和主内存区之间。

*

* |---|---|------------------|---------------------|-------------------|

* | | | * * * | buffer | |

* |---|---|------------------|---------------------|-------------------|

* | /|/

* |------------------------------------|

* /|/

* buffer_head (list)

*/

/*

* linux/fs/buffer.c

*

* (C) 1991 Linus Torvalds

*/

/*

* 'buffer.c' implements the buffer-cache functions. Race-conditions have

* been avoided by NEVER letting a interrupt change a buffer (except for the

* data, of course), but instead letting the caller do it. NOTE! As interrupts

* can wake up a caller, some cli-sti sequences are needed to check for

* sleep-on-calls. These should be extremely quick, though (I hope).

*/

/*

* NOTE! There is one discordant note here: checking floppies for

* disk change. This is where it fits best, I think, as it should

* invalidate changed floppy-disk-caches.

*/

#include <stdarg.h>

#include <linux/config.h>

#include <linux/sched.h>

#include <linux/kernel.h>

#include <asm/system.h>

#include <asm/io.h>

extern int end; // 由连接程序ld 生成的表明程序末端的变量,代表的是一个内存地址

struct buffer_head * start_buffer = (struct buffer_head *) &end;

struct buffer_head * hash_table[NR_HASH];

static struct buffer_head * free_list;

static struct task_struct * buffer_wait = NULL;

int NR_BUFFERS = 0;

/*等待指定缓冲区解锁 */

static inline void wait_on_buffer(struct buffer_head * bh)

{

cli();

while (bh->b_lock)

sleep_on(&bh->b_wait);

sti();

}

/* 同步设备(存储介质)和内存高速缓冲中数据 */

int sys_sync(void)

{

int i;

struct buffer_head * bh;

/*

* sync_inodes的主要作用是把inode_table中的inode与磁盘上的一致起来。若

* 这样笼统的理解,但是这里牵涉到系统高速缓冲区。由此,同步操作实际被分

* 成了两个阶段:

* 1. 数据结构信息与高速缓冲区中的缓冲块同步问题,由相关程序独立负责;

* 2. 高速缓冲区中数据块与磁盘对应块的同步问题,由缓冲管理程序负责。

* sync_inodes不会直接与磁盘打交道,它只能前进到缓冲区这一步.

*

* inode ------- 高速缓冲buffer --------- 硬盘

*

*/

/* 将i 节点写入高速缓冲 */

sync_inodes(); /* write out inodes into buffers */

bh = start_buffer;

for (i=0 ; i<NR_BUFFERS ; i++,bh++)

{

wait_on_buffer(bh); // 等待缓冲区解锁

if (bh->b_dirt)

ll_rw_block(WRITE,bh); // 产生写设备块请求

}

return 0;

}

/* 高速缓冲与硬盘上数据的同步 */

int sync_dev(int dev)

{

int i;

struct buffer_head * bh;

/* 高速缓冲buffer -- 存储介质 */

bh = start_buffer;

for (i=0 ; i<NR_BUFFERS ; i++,bh++)

{

if (bh->b_dev != dev) // look for the dev

continue;

wait_on_buffer(bh);

if (bh->b_dev == dev && bh->b_dirt)

ll_rw_block(WRITE,bh);

}

/* 数据结构inode -- 高速缓冲 */

sync_inodes(); // 将i 节点数据写入高速缓冲

/* 高速缓冲buffer -- 存储介质 */

bh = start_buffer;

for (i=0 ; i<NR_BUFFERS ; i++,bh++)

{

if (bh->b_dev != dev)

continue;

wait_on_buffer(bh);

if (bh->b_dev == dev && bh->b_dirt)

ll_rw_block(WRITE,bh);

}

return 0;

}

/* 指定设备在高速缓冲区中的数据无效 */

void inline invalidate_buffers(int dev)

{

int i;

struct buffer_head * bh;

bh = start_buffer;

for (i=0 ; i<NR_BUFFERS ; i++,bh++)

{

if (bh->b_dev != dev)

continue;

wait_on_buffer(bh);

if (bh->b_dev == dev)

// 指定设备在高速缓冲区中的数据无效

bh->b_uptodate = bh->b_dirt = 0;

}

}

/*

* This routine checks whether a floppy has been changed, and

* invalidates all buffer-cache-entries in that case. This

* is a relatively slow routine, so we have to try to minimize using

* it. Thus it is called only upon a 'mount' or 'open'. This

* is the best way of combining speed and utility, I think.

* People changing diskettes in the middle of an operation deserve

* to loose :-)

*

* NOTE! Although currently this is only for floppies, the idea is

* that any additional removable block-device will use this routine,

* and that mount/open needn't know that floppies/whatever are

* special.

*/

/*

* 该子程序检查一个软盘是否已经被更换,如果已经更换就使高速缓冲中与该软驱

* 对应的所有缓冲区无效。该子程序相对来说较慢,所以我们要尽量少使用它。

*/

/* 检查磁盘是否更换 */

void check_disk_change(int dev)

{

int i;

if (MAJOR(dev) != 2) // 是软盘设备吗?

return;

if (!floppy_change(dev & 0x03)) // 对应软盘是否已更换 ?

return;

/* 软盘已经更换 */

for (i=0 ; i<NR_SUPER ; i++)

if (super_block[i].s_dev == dev)

// 释放对应设备的i 节点位图和逻辑块位图所占的高速缓冲区

put_super(super_block[i].s_dev);

invalidate_inodes(dev); // i 节点无效

invalidate_buffers(dev); // 数据块信息无效

}

#define _hashfn(dev,block) (((unsigned)(dev^block))%NR_HASH) // hash 函数

#define hash(dev,block) hash_table[_hashfn(dev,block)] // hash 表项

/* 从hash 队列和空闲缓冲队列中移走指定的缓冲块 */

/* 在数据结构中,包含两个数组,使用两个数组来实现两个链表 */

/* 对于每一块的话,她同时存在于hash_table可寻的范围,同时也可能在free list链表上 */

static inline void remove_from_queues(struct buffer_head * bh)

{

/* remove from hash-queue */

/* 从hash 队列中移除缓冲块,只是对应的指针操作,原因是数据结构 */

/* 采用的是数组的形式来存储的信息 */

if (bh->b_next)

bh->b_next->b_prev = bh->b_prev;

if (bh->b_prev)

bh->b_prev->b_next = bh->b_next;

/* 如果该缓冲区是该队列的头一个块,则让hash 表的对应项指向本队列中的下一个缓冲区 */

/*

* |------|--------|------|-------|-------|

* | | | | | | hash_table

* |------|--------|------|-------|-------|

* |

* /|/

* a link list(if it is the first block)

*/

if (hash(bh->b_dev,bh->b_blocknr) == bh)

hash(bh->b_dev,bh->b_blocknr) = bh->b_next;

/* remove from free list */

/* 从空闲缓冲区表中移除缓冲块 */

if (!(bh->b_prev_free) || !(bh->b_next_free))

panic("Free block list corrupted");

bh->b_prev_free->b_next_free = bh->b_next_free;

bh->b_next_free->b_prev_free = bh->b_prev_free;

// 如果空闲链表头指向本缓冲区,则让其指向下一缓冲区

if (free_list == bh)

free_list = bh->b_next_free;

}

/* 将指定缓冲区插入空闲链表尾并放入hash 队列中,同上 */

static inline void insert_into_queues(struct buffer_head * bh)

{

/* put at end of free list */

bh->b_next_free = free_list;

bh->b_prev_free = free_list->b_prev_free;

free_list->b_prev_free->b_next_free = bh;

free_list->b_prev_free = bh;

/* put the buffer in new hash-queue if it has a device */

bh->b_prev = NULL;

bh->b_next = NULL;

if (!bh->b_dev)

return;

bh->b_next = hash(bh->b_dev,bh->b_blocknr);

hash(bh->b_dev,bh->b_blocknr) = bh;

bh->b_next->b_prev = bh;

}

/* 在高速缓冲中寻找给定设备和指定块的缓冲区块,返回的是指定的buffer_head */

static struct buffer_head * find_buffer(int dev, int block)

{

struct buffer_head * tmp;

/* dev, block --hash--> tmp (a member of the hash table) --> has free block ? */

/* 可能存在哈希的冲突 */

for (tmp = hash(dev,block) ; tmp != NULL ; tmp = tmp->b_next)

if (tmp->b_dev==dev && tmp->b_blocknr==block)

return tmp;

return NULL;

}

/*

* Why like this, I hear you say... The reason is race-conditions.

* As we don't lock buffers (unless we are readint them, that is),

* something might happen to it while we sleep (ie a read-error

* will force it bad). This shouldn't really happen currently, but

* the code is ready.

*/

/* 函数get_hash_table()在哈希链表中查找是否存在给定条件(dev,block,size)的buffer_head对象 */

struct buffer_head * get_hash_table(int dev, int block)

{

struct buffer_head * bh;

for (;;)

{

if (!(bh=find_buffer(dev,block)))

return NULL;

bh->b_count++; // 增加引用计数

wait_on_buffer(bh); // 等待该缓冲区解锁

// 经过了睡眠状态

if (bh->b_dev == dev && bh->b_blocknr == block)

return bh;

// 如果该缓冲区所属的设备号或块号在睡眠时发生了改变,则撤消对它的引用计数

bh->b_count--;

}

}

/*

* Ok, this is getblk, and it isn't very clear, again to hinder

* race-conditions. Most of the code is seldom used, (ie repeating),

* so it should be much more efficient than it looks.

*

* The algorithm is changed: hopefully better, and an elusive bug removed.

*/

/* 相当于一个权值,比较哪个空闲块最适合 */

#define BADNESS(bh) (((bh)->b_dirt<<1)+(bh)->b_lock)

/* 取高速缓冲区中指定的缓冲区 */

struct buffer_head * getblk(int dev,int block)

{

struct buffer_head * tmp, * bh;

repeat:

// 搜索hash 表,如果指定块已经在高速缓冲中

if (bh = get_hash_table(dev,block))

return bh;

// 如果指定的缓冲块还没存在,扫描空闲数据块链表,寻找空闲缓冲区

tmp = free_list;

do {

if (tmp->b_count) // 如果该缓冲区正被使用

continue; // 继续扫描下一项

// 缓冲头指针bh 为空,或者tmp 所指缓冲头的标志(修改、锁定)

// 权重小于bh 头标志的权重,寻找最合适的块

if (!bh || BADNESS(tmp)<BADNESS(bh))

{

bh = tmp; // 让bh 指向该tmp 缓冲区头

// 如果该tmp 缓冲区头表明缓冲区既没有修改也没有锁定标志置位

if (!BADNESS(tmp))

// 说明已为指定设备上的块取得对应的高速缓冲区

break;

}

/* and repeat until we find something good,while结束时bh中存放的是空闲的缓冲块 */

} while ((tmp = tmp->b_next_free) != free_list);

// 如果所有缓冲区都正被使用(所有缓冲区的头部引用计数都>0)

if (!bh)

{

sleep_on(&buffer_wait); // 睡眠

goto repeat;

}

// 睡醒,等待该缓冲区解锁

wait_on_buffer(bh);

if (bh->b_count) // 如果该缓冲区又被其它任务使用的话?

goto repeat;

while (bh->b_dirt) // 该缓冲区已被修改

{

sync_dev(bh->b_dev); // 将数据写盘

wait_on_buffer(bh); // 再次等待缓冲区解锁

if (bh->b_count) // 该缓冲区又被其它任务使用

goto repeat; // 只好再重复上述过程

}

/* NOTE!! While we slept waiting for this block, somebody else might */

/* already have added "this" block to the cache. check it */

/* 注意!当进程为了等待该缓冲块而睡眠时,其它进程可能已经将该缓冲块 */

// 在高速缓冲hash 表中检查指定设备和块的缓冲区是否已经被加入进去

if (find_buffer(dev,block))

goto repeat;

/* OK, FINALLY we know that this buffer is the only one of it's kind, */

/* and that it's unused (b_count=0), unlocked (b_lock=0), and clean */

/* OK,最终我们知道该缓冲区是指定参数的唯一一块 */

// 于是让我们占用此缓冲区。置引用计数为1,复位修改标志和有效(更新)标志

bh->b_count=1;

bh->b_dirt=0;

bh->b_uptodate=0;

// 从hash 队列和空闲块链表中移出该缓冲区头

// 让该缓冲区用于指定设备和其上的指定块

remove_from_queues(bh);

bh->b_dev=dev;

bh->b_blocknr=block;

// 然后根据此新的设备号和块号重新插入空闲链表和hash 队列新位置处

insert_into_queues(bh);

return bh; // 并最终返回缓冲头指针

/*

* 该函数的最终目的是寻找到一块没有使用的缓冲块。linux中的缓冲块的

* 目的是就是在设备和读写操作之间提供的暂存数据的地方。如果通过get_hash_table

* 函数计算的出的值不是NULL,说明该块缓冲区已经存在,直接返回即可。

* 否则需要寻找合适缓冲块,方法是从空闲链表free_list中寻找一块

* ,然后将其插入到相应的位置上,最后返回bh指针

*/

}

/* 释放指定的缓冲区 */

void brelse(struct buffer_head * buf)

{

// 等待该缓冲区解锁。引用计数递减1。唤醒等待空闲缓冲区的进程

if (!buf)

return;

wait_on_buffer(buf);

if (!(buf->b_count--))

panic("Trying to free free buffer");

wake_up(&buffer_wait);

}

/*

* bread() reads a specified block and returns the buffer that contains

* it. It returns NULL if the block was unreadable.

*/

/*

* 从设备上读取指定的数据块并返回含有数据的缓冲区。如果指定的块不存在

* 则返回NULL.

*/

struct buffer_head * bread(int dev,int block)

{

struct buffer_head * bh;

if (!(bh=getblk(dev,block))) // 在高速缓冲中申请一块缓冲区

panic("bread: getblk returned NULL/n");

// 如果该缓冲区中的数据是有效的(已更新的)可以直接使用

if (bh->b_uptodate)

return bh;

// 否则调用ll_rw_block()函数,产生读设备块请求

ll_rw_block(READ,bh);

wait_on_buffer(bh);

// 如果该缓冲区已更新,则返回缓冲区头指针

if (bh->b_uptodate)

return bh;

// 否则表明读设备操作失败,释放该缓冲区,返回NULL 指针,退出

brelse(bh);

return NULL;

}

/* 从from 地址复制一块数据到to 位置 */

#define COPYBLK(from,to) /

__asm__("cld/n/t" /

"rep/n/t" /

"movsl/n/t" /

::"c" (BLOCK_SIZE/4),"S" (from),"D" (to) /

:"cx","di","si")

/*

* bread_page reads four buffers into memory at the desired address. It's

* a function of its own, as there is some speed to be got by reading them

* all at the same time, not waiting for one to be read, and then another

* etc.

*/

/* 读设备上一个页面(4 个缓冲块)的内容到内存指定的地址 */

void bread_page(unsigned long address,int dev,int b[4])

{

struct buffer_head * bh[4];

int i;

/* 循环四次得到四个buffer_head指针 */

for (i=0 ; i<4 ; i++)

if (b[i]) {

if (bh[i] = getblk(dev,b[i]))

if (!bh[i]->b_uptodate)

ll_rw_block(READ,bh[i]);

} else

bh[i] = NULL;

/* 将buffer_head指针对应的缓冲区数据读到address中 */

for (i=0 ; i<4 ; i++,address += BLOCK_SIZE)

if (bh[i]) {

wait_on_buffer(bh[i]);

if (bh[i]->b_uptodate)

COPYBLK((unsigned long) bh[i]->b_data,address);

brelse(bh[i]);

}

}

/*

* Ok, breada can be used as bread, but additionally to mark other

* blocks for reading as well. End the argument list with a negative

* number.

*/

/*

* breada 可以象bread 一样使用,但会另外预读一些块。该函数参数列表

* 需要使用一个负数来表明参数列表的结束。

*/

struct buffer_head * breada(int dev,int first, ...)

{

va_list args;

struct buffer_head * bh, *tmp;

va_start(args,first); // 取可变参数表中第1 个参数(块号)

if (!(bh=getblk(dev,first))) // 取高速缓冲中指定设备和块号的缓冲区

panic("bread: getblk returned NULL/n");

// 如果该缓冲区数据无效,则发出读设备数据块请求

if (!bh->b_uptodate)

ll_rw_block(READ,bh);

// 顺序取可变参数表中其它预读块号,并作与上面同样处理

while ((first=va_arg(args,int))>=0)

{

tmp=getblk(dev,first);

if (tmp)

{

if (!tmp->b_uptodate)

ll_rw_block(READA,bh);

tmp->b_count--;

}

}

va_end(args); // 可变参数表中所有参数处理完毕

wait_on_buffer(bh); // 等待第1 个缓冲区解锁

if (bh->b_uptodate) // 数据有效 ?

return bh;

brelse(bh); // 释放该缓冲区

return (NULL);

}

/* 缓冲区初始化函数, 参数buffer_end 是指定的缓冲区内存的末端 */

void buffer_init(long buffer_end)

{

struct buffer_head * h = start_buffer;

void * b;

int i;

/* 获得缓冲区的高端,存放在变量b中 */

if (buffer_end == 1<<20)

b = (void *) (640*1024);

else

b = (void *) buffer_end;

/*

* h(start_buffer) b(buffer_end)

* /|/ /|/

* |-buffer_head--|----|***|-----buffer-------|----------------|

*

*/

while ( (b -= BLOCK_SIZE) >= ((void *) (h+1)) ) // 直到无法分配

{

h->b_dev = 0;

h->b_dirt = 0;

h->b_count = 0;

h->b_lock = 0;

h->b_uptodate = 0;

h->b_wait = NULL;

/* 散列hash_table之后没有链表 */

h->b_next = NULL;

h->b_prev = NULL;

h->b_data = (char *) b;

/* 形成free list */

h->b_prev_free = h-1;

h->b_next_free = h+1;

h++;

NR_BUFFERS++;

if (b == (void *) 0x100000)

b = (void *) 0xA0000;

}

/* 形成双向链表 */

h--;

free_list = start_buffer;

free_list->b_prev_free = h;

h->b_next_free = free_list;

// 初始化hash 表(哈希表、散列表),置表中所有的指针为NULL

for (i=0;i<NR_HASH;i++)

hash_table[i]=NULL;

/*

* 在该函数buffer_init调用之后,首先建立的是如下的两个内存结构:

* |-------------|

* | | hash_table[0->size] = NULL

* | * * * |

* |-------------|

*

* h(start_buffer) b(buffer_end)

* /|/ /|/

* |-buffer_head--|----|***|-----buffer-------|----------------|

*

* 现在如果是产生第一个一个新的请求的话, 在函数getblk中首先是调用函数

* get_hash_table,在该函数中调用函数buffer_head,返回NULL(该哈希表中

* 不存在相应的缓冲块),然后寻找到一块,并相应的修改数据。

*

* |-------------|

* |-------------| hash_table[x] != NULL即是刚刚插入的一项

* | * * * |

* |-------------|

*

* h(start_buffer) b(buffer_end)

* /|/ /|/

* |-buffer_head--|----|***|-----buffer-------|----------------|

* 已经分配b_count != 0

* 下面就是继续这个过程

*/

}

参考《linux内核完全注释》和网上相关资料
目录树 下面再给个样例 ├─Makefile │ ├─boot │ bootsect.s │ head.s │ setup.s │ ├─fs │ bitmap.c │ block_dev.c │ buffer.c │ char_dev.c │ exec.c │ fcntl.c │ file_dev.c │ file_table.c │ inode.c │ ioctl.c │ Makefile │ namei.c │ open.c │ pipe.c │ read_write.c │ stat.c │ super.c │ truncate.c │ ├─include │ │ a.out.h │ │ const.h │ │ ctype.h │ │ errno.h │ │ fcntl.h │ │ signal.h │ │ stdarg.h │ │ stddef.h │ │ string.h │ │ termios.h │ │ time.h │ │ unistd.h │ │ utime.h │ │ │ ├─asm │ │ io.h │ │ memory.h │ │ segment.h │ │ system.h │ │ │ ├─linux │ │ config.h │ │ fs.h │ │ hdreg.h │ │ head.h │ │ kernel.h │ │ mm.h │ │ sched.h │ │ sys.h │ │ tty.h │ │ │ └─sys │ stat.h │ times.h │ types.h │ utsname.h │ wait.h │ ├─init │ main.c │ ├─kernel │ │ asm.s │ │ exit.c │ │ fork.c │ │ mktime.c │ │ panic.c │ │ printk.c │ │ sched.c │ │ signal.c │ │ sys.c │ │ system_call.s │ │ vsprintf.c │ │ │ ├─blk_drv │ │ blk.h │ │ floppy.c │ │ hd.c │ │ ll_rw_blk.c │ │ Makefile │ │ ramdisk.c │ │ │ ├─chr_drv │ │ console.c │ │ keyboard.S │ │ Makefile │ │ rs_io.s │ │ serial.c │ │ tty_io.c │ │ tty_ioctl.c │ │ │ └─math │ Makefile │ math_emulate. │ ├─lib │ close.c │ ctype.c │ dup.c │ errno.c │ execve.c │ Makefile │ malloc.c │ open.c │ setsid.c │ string.c │ wait.c │ write.c │ _exit.c │ ├─mm │ Makefile │ memory.c │ page.s │ └─tools build.c 样例 main。c 用sourceinsight软件阅读 很方便 /* * linux/init/main.c * * (C) 1991 Linus Torvalds */ #define __LIBRARY__ // 定义该变量是为了包括定义在unistd.h 中的内嵌汇编代码等信息。 #include // *.h 头文件所在的默认目录是include/,则在代码中就不用明确指明位置。 // 如果不是UNIX 的标准头文件,则需要指明所在的目录,并用双引号括住。 // 标准符号常数类型文件。定义了各种符号常数和类型,并申明了各种函数。 // 如果定义了__LIBRARY__,则还包括系统调用号和内嵌汇编代码_syscall0()等。 #include // 时间类型头文件。其中最主要定义了tm 结构和一些有关时间的函数原形。 /* * we need this inline - forking from kernel space will result * in NO COPY ON WRITE (!!!), until an execve is executed. This * is no problem, but for the stack. This is handled by not letting * main() use the stack at all after fork(). Thus, no function * calls - which means inline code for fork too, as otherwise we * would use the stack upon exit from 'fork()'. * * Actually only pause and fork are needed inline, so that there * won't be any messing with the stack from main(), but we define * some others too. */ /* * 我们需要下面这些内嵌语句 -内核空间创建进程(forking)将导致没有写时复制(COPY ON WRITE)!!! * 直到一个执行execve 调用。这对堆栈可能带来问题。处理的方法是在fork()调用之后不让main()使用 * 任何堆栈。因此就不能有函数调用 - 这意味着fork 也要使用内嵌的代码,否则我们在从fork()退出 * 时就要使用堆栈了。 * 实际上只有pause 和fork 需要使用内嵌方式,以保证从main()中不会弄乱堆栈,但是我们同时还 * 定义了其它一些函数。 */ static inline _syscall0 (int, fork) // 是unistd.h 中的内嵌宏代码。以嵌入汇编的形式调用 // Linux 的系统调用中断0x80。该中断是所有系统调用的 // 入口。该条语句实际上是int fork()创建进程系统调用。 // syscall0 名称中最后的0 表示无参数,1 表示1 个参数。 static inline _syscall0 (int, pause) // int pause()系统调用:暂停进程的执行,直到 // 收到一个信号。 static inline _syscall1 (int, setup, void *, BIOS) // int setup(void * BIOS)系统调用,仅用于 // linux 初始化(仅在这个程序中被调用)。 static inline _syscall0 (int, sync) // int sync()系统调用:更新文件系统。 #include // tty 头文件,定义了有关tty_io,串行通信方面的参数、常数。 #include // 调度程序头文件,定义了任务结构task_struct、第1 个初始任务 // 的数据。还有一些以宏的形式定义的有关描述符参数设置和获取的 // 嵌入式汇编函数程序。 #include // head 头文件,定义了段描述符的简单结构,和几个选择符常量。 #include // 系统头文件。以宏的形式定义了许多有关设置或修改 // 描述符/中断门等的嵌入式汇编子程序。 #include // io 头文件。以宏的嵌入汇编程序形式定义对io 端口操作的函数。 #include // 标准定义头文件。定义了NULL, offsetof(TYPE, MEMBER)。 #include // 标准参数头文件。以宏的形式定义变量参数列表。主要说明了-个 // 类型(va_list)和三个宏(va_start, va_arg 和va_end),vsprintf、 // vprintf、vfprintf。 #include #include // 文件控制头文件。用于文件及其描述符的操作控制常数符号的定义。 #include // 类型头文件。定义了基本的系统数据类型。 #include // 文件系统头文件。定义文件表结构(file,buffer_head,m_inode 等)。 static char printbuf[1024]; // 静态字符串数组。 extern int vsprintf (); // 送格式化输出到一字符串中(在kernel/vsprintf.c,92 行)。 extern void init (void); // 函数原形,初始化(在168 行)。 extern void blk_dev_init (void); // 块设备初始化子程序(kernel/blk_drv/ll_rw_blk.c,157 行) extern void chr_dev_init (void); // 字符设备初始化(kernel/chr_drv/tty_io.c, 347 行) extern void hd_init (void); // 硬盘初始化程序(kernel/blk_drv/hd.c, 343 行) extern void floppy_init (void); // 软驱初始化程序(kernel/blk_drv/floppy.c, 457 行) extern void mem_init (long start, long end); // 内存管理初始化(mm/memory.c, 399 行) extern long rd_init (long mem_start, int length); //虚拟盘初始化(kernel/blk_drv/ramdisk.c,52) extern long kernel_mktime (struct tm *tm); // 建立内核时间(秒)。 extern long startup_time; // 内核启动时间(开机时间)(秒)。 /* * This is set up by the setup-routine at boot-time */ /* * 以下这些数据是由setup.s 程序在引导时间设置的(参见第2 章2.3.1 节中的表2.1)。 */ #define EXT_MEM_K (*(unsigned short *)0x90002) // 1M 以后的扩展内存大小(KB)。 #define DRIVE_INFO (*(struct drive_info *)0x90080) // 硬盘参数表基址。 #define ORIG_ROOT_DEV (*(unsigned short *)0x901FC) // 根文件系统所在设备号。 /* * Yeah, yeah, it's ugly, but I cannot find how to do this correctly * and this seems to work. I anybody has more info on the real-time * clock I'd be interested. Most of this was trial and error, and some * bios-listing reading. Urghh. */ /* * 是啊,是啊,下面这段程序很差劲,但我不知道如何正确地实现,而且好象它还能运行。如果有 * 关于实时时钟更多的资料,那我很感兴趣。这些都是试探出来的,以及看了一些bios 程序,呵! */ #define CMOS_READ(addr) ({ \ // 这段宏读取CMOS 实时时钟信息。 outb_p (0x80 | addr, 0x70); \ // 0x70 是写端口号,0x80|addr 是要读取的CMOS 内存地址。 inb_p (0x71); \ // 0x71 是读端口号。 } ) #define BCD_TO_BIN(val) ((val)=((val)&15) + ((val)>>4)*10) // 将BCD 码转换成数字。 static void time_init (void) // 该子程序取CMOS 时钟,并设置开机时间??startup_time(秒)。 { struct tm time; do { time.tm_sec = CMOS_READ (0); // 参见后面CMOS 内存列表。 time.tm_min = CMOS_READ (2); time.tm_hour = CMOS_READ (4); time.tm_mday = CMOS_READ (7); time.tm_mon = CMOS_READ (8); time.tm_year = CMOS_READ (9); } while (time.tm_sec != CMOS_READ (0)); BCD_TO_BIN (time.tm_sec); BCD_TO_BIN (time.tm_min); BCD_TO_BIN (time.tm_hour); BCD_TO_BIN (time.tm_mday); BCD_TO_BIN (time.tm_mon); BCD_TO_BIN (time.tm_year); time.tm_mon--; startup_time = kernel_mktime (&time); } static long memory_end = 0; // 机器具有的内存(字节数)。 static long buffer_memory_end = 0; // 高速缓冲区末端地址。 static long main_memory_start = 0; // 主内存(将用于分页)开始的位置。 struct drive_info { char dummy[32]; } drive_info; // 用于存放硬盘参数表信息。 void main (void) /* This really IS void, no error here. */ { /* The startup routine assumes (well, ...) this */ /* 这里确实是void,并没错。在startup 程序(head.s)中就是这样假设的。 */ // 参见head.s 程序第136 行开始的几行代码。 /* * Interrupts are still disabled. Do necessary setups, then * enable them */ /* * 此时中断仍被禁止着,做完必要的设置后就将其开启。 */ // 下面这段代码用于保存: // 根设备号 ??ROOT_DEV; 高速缓存末端地址??buffer_memory_end; // 机器内存数??memory_end;主内存开始地址 ??main_memory_start; ROOT_DEV = ORIG_ROOT_DEV; drive_info = DRIVE_INFO; memory_end = (1 << 20) + (EXT_MEM_K < 16 * 1024 * 1024) // 如果内存超过16Mb,则按16Mb 计。 memory_end = 16 * 1024 * 1024; if (memory_end > 12 * 1024 * 1024) // 如果内存>12Mb,则设置缓冲区末端=4Mb buffer_memory_end = 4 * 1024 * 1024; else if (memory_end > 6 * 1024 * 1024) // 否则如果内存>6Mb,则设置缓冲区末端=2Mb buffer_memory_end = 2 * 1024 * 1024; else buffer_memory_end = 1 * 1024 * 1024; // 否则则设置缓冲区末端=1Mb main_memory_start = buffer_memory_end; // 主内存起始位置=缓冲区末端; #ifdef RAMDISK // 如果定义了虚拟盘,则主内存将减少。 main_memory_start += rd_init (main_memory_start, RAMDISK * 1024); #endif // 以下是内核进行所有方面的初始化工作。阅读时最好跟着调用的程序深入进去看,实在看 // 不下去了,就先放一放,看下一个初始化调用 -- 这是经验之谈?。 mem_init (main_memory_start, memory_end); trap_init (); // 陷阱门(硬件中断向量)初始化。(kernel/traps.c,181 行) blk_dev_init (); // 块设备初始化。 (kernel/blk_dev/ll_rw_blk.c,157 行) chr_dev_init (); // 字符设备初始化。 (kernel/chr_dev/tty_io.c,347 行) tty_init (); // tty 初始化。 (kernel/chr_dev/tty_io.c,105 行) time_init (); // 设置开机启动时间??startup_time(见76 行)。 sched_init (); // 调度程序初始化(加载了任务0 的tr, ldtr) (kernel/sched.c,385) buffer_init (buffer_memory_end); // 缓冲管理初始化,建内存链表等。(fs/buffer.c,348) hd_init (); // 硬盘初始化。 (kernel/blk_dev/hd.c,343 行) floppy_init (); // 软驱初始化。 (kernel/blk_dev/floppy.c,457 行) sti (); // 所有初始化工作都做完了,开启中断。 // 下面过程通过在堆栈中设置的参数,利用中断返回指令切换到任务0。 move_to_user_mode (); // 移到用户模式。 (include/asm/system.h,第1 行) if (!fork ()) { /* we count on this going ok */ init (); } /* * NOTE!! For any other task 'pause()' would mean we have to get a * signal to awaken, but task0 is the sole exception (see 'schedule()') * as task 0 gets activated at every idle moment (when no other tasks * can run). For task0 'pause()' just means we go check if some other * task can run, and if not we return here. */ /* 注意!! 对于任何其它的任务,'pause()'将意味着我们必须等待收到一个信号才会返 * 回就绪运行态,但任务0(task0)是唯一的意外情况(参见'schedule()'),因为任务0 在 * 任何空闲时间里都会被激活(当没有其它任务在运行时),因此对于任务0'pause()'仅意味着 * 我们返回来查看是否有其它任务可以运行,如果没有的话我们就回到这里,一直循环执行'pause()'。 */ for (;;) pause (); } static int printf (const char *fmt, ...) // 产生格式化信息并输出到标准输出设备stdout(1),这里是指屏幕上显示。参数'*fmt'指定输出将 // 采用的格式,参见各种标准C 语言书籍。该子程序正好是vsprintf 如何使用的一个例子。 // 该程序使用vsprintf()将格式化的字符串放入printbuf 缓冲区,然后用write()将缓冲区的内容 // 输出到标准设备(1--stdout)。 { va_list args; int i; va_start (args, fmt); write (1, printbuf, i = vsprintf (printbuf, fmt, args)); va_end (args); return i; } static char *argv_rc[] = { "/bin/sh", NULL}; // 调用执行程序时参数的字符串数组。 static char *envp_rc[] = { "HOME=/", NULL}; // 调用执行程序时的环境字符串数组。 static char *argv[] = { "-/bin/sh", NULL}; // 同上。 static char *envp[] = { "HOME=/usr/root", NULL}; void init (void) { int pid, i; // 读取硬盘参数包括分区表信息并建立虚拟盘和安装根文件系统设备。 // 该函数是在25 行上的宏定义的,对应函数是sys_setup(),在kernel/blk_drv/hd.c,71 行。 setup ((void *) &drive_info); (void) open ("/dev/tty0", O_RDWR, 0); // 用读写访问方式打开设备“/dev/tty0”, // 这里对应终端控制台。 // 返回的句柄号0 -- stdin 标准输入设备。 (void) dup (0); // 复制句柄,产生句柄1 号 -- stdout 标准输出设备。 (void) dup (0); // 复制句柄,产生句柄2 号 -- stderr 标准出错输出设备。 printf ("%d buffers = %d bytes buffer space\n\r", NR_BUFFERS, NR_BUFFERS * BLOCK_SIZE); // 打印缓冲区块数和总字节数,每块1024 字节。 printf ("Free mem: %d bytes\n\r", memory_end - main_memory_start); //空闲内存字节数。 // 下面fork()用于创建一个子进程(子任务)。对于被创建的子进程,fork()将返回0 值, // 对于原(父进程)将返回子进程的进程号。所以180-184 句是子进程执行的内容。该子进程 // 关闭了句柄0(stdin),以只读方式打开/etc/rc 文件,并执行/bin/sh 程序,所带参数和 // 环境变量分别由argv_rc 和envp_rc 数组给出。参见后面的描述。 if (!(pid = fork ())) { close (0); if (open ("/etc/rc", O_RDONLY, 0)) _exit (1); // 如果打开文件失败,则退出(/lib/_exit.c,10)。 execve ("/bin/sh", argv_rc, envp_rc); // 装入/bin/sh 程序并执行。 _exit (2); // 若execve()执行失败则退出(出错码2,“文件或目录不存在”)。 } // 下面是父进程执行的语句。wait()是等待子进程停止或终止,其返回值应是子进程的进程号(pid)。 // 这三句的作用是父进程等待子进程的结束。&i 是存放返回状态信息的位置。如果wait()返回值不 // 等于子进程号,则继续等待。 if (pid > 0) while (pid != wait (&i)) /* nothing */ ; // 如果执行到这里,说明刚创建的子进程的执行已停止或终止了。下面循环中首先再创建一个子进程, // 如果出错,则显示“初始化程序创建子进程失败”的信息并继续执行。对于所创建的子进程关闭所有 // 以前还遗留的句柄(stdin, stdout, stderr),新创建一个会话并设置进程组号,然后重新打开 // /dev/tty0 作为stdin,并复制成stdout 和stderr。再次执行系统解释程序/bin/sh。但这次执行所 // 选用的参数和环境数组另选了一套(见上面165-167 行)。然后父进程再次运行wait()等待。如果 // 子进程又停止了执行,则在标准输出上显示出错信息“子进程pid 停止了运行,返回码是i”,然后 // 继续重试下去…,形成“大”死循环。 while (1) { if ((pid = fork ()) < 0) { printf ("Fork failed in init\r\n"); continue; } if (!pid) { close (0); close (1); close (2); setsid (); (void) open ("/dev/tty0", O_RDWR, 0); (void) dup (0); (void) dup (0); _exit (execve ("/bin/sh", argv, envp)); } while (1) if (pid == wait (&i)) break; printf ("\n\rchild %d died with code %04x\n\r", pid, i); sync (); } _exit (0); /* NOTE! _exit, not exit() */ }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值