块设备(二)

本文深入解析了块设备驱动的工作原理,特别是数据访问流程。详细介绍了如何通过generic_make_request创建请求,以及__generic_make_request和make_request_fn的作用。此外,还探讨了如何自定义make_request函数以绕过IO调度器直接处理bio,提高访问效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

块设备驱动()

块设备数据访问流程:

generic_make_request () ------> __genenric_make_request() -----> q->make_request_fn(q, bio)

当有用户需求来的时候,在通用块层使用generic_make_request () 形成一个请求,然后调用

__genenric_make_request(bio)形成一个bio,再调用块设备请求队列的q->make_request_fn(q, bio),每个块设备请求队列request_queue都有一个函数指针,

struct request_queue {

.......................

make_request_fn  *make_request_fn ;

......................

}

struct request_queue *blk_init_queue(request_fn_proc *rfnspinlock *lock) {

return blk_init_queue_node (rfnlock-1)

}

blk_init_queue_node (request_fn_proc *rfnspinlock *lock) {

......................

blk_queue_make_request (q,  __make_request) ; //把等待队列q和函数__make_request关联,__make_request负责制造struct request,每个请求由struct request描述

.........................

}

void blk_queue_make_request (struct request_queue *qmake_request_fn  *mfn) {

.........................

q->make_request_fn = mfn ;

.........................

}

 make_request制造请求元素是Bio1struct Bio代表一次块设备I/O请求,IO调度器可将连续的bio合并成一个请求struct request,对每个扇区的访问就是一个biorequest把连续的访问合在一起,通过__make_reques按照调度算法访问磁盘合并bio,提高访问效率。

struct bio {

secotor_t  bi_sector ; //要访问的第一个扇区

unsigned int bi_size ; //以字节为单位传输数据的大小

struct bio_vec *bi_io_vec ; //实际的vec列表

...........................

};

 struct  bio_vec {

struct page *bv_page ; //页指针

unsigned int bv_len ; //传输的数据长度

unsigned int bv_offset ; //偏移量

}; //反应用户信息,从磁盘读取数据的存放位置,存放在哪一页以及偏移

有的块设备需要调度算法去支撑,比如磁盘的磁头要移动,但是有的设备没有这种移动,比如内存、U盘,就不要这种调度器,不用制作make_request,直接依次处理bio,这样就不会形成register。要直接处理bio就不许内核提供的处理函数__make_request,自己实现请求队列里的__make_request_fn

自己实现:

request_queue_t *blk_alloc_queue (int gfp_mask) 分配一个请求队列。

void blk_queue_make_request (request_queue_t *q,  make_request_fn *mfn)

把自己实现的bio请求处理函数mfn赋值给请求队列q里的成员q->make_request_fn = mfn

 

块设备驱动程序(不使用IO调度器)
#define SIMP_BLKDEV_DEVICEMAJOR        COMPAQ_SMART2_MAJOR
#define SIMP_BLKDEV_DISKNAME        "simp_blkdev"
#define SIMP_BLKDEV_BYTES        (16*1024*1024)

static struct request_queue *simp_blkdev_queue;
static struct gendisk *simp_blkdev_disk;
unsigned char simp_blkdev_data[SIMP_BLKDEV_BYTES];

static int simp_blkdev_make_request(struct request_queue *q, struct bio *bio)
//在simple-blk.c传给request_queue,从里取出request处理,这里传给request和bio
{
        struct bio_vec *bvec;
        int i;
        void *dsk_mem;

        if ((bio->bi_sector << 9) + bio->bi_size > SIMP_BLKDEV_BYTES) {
  //访问数据量是否超出磁盘范围
                printk(KERN_ERR SIMP_BLKDEV_DISKNAME
                        ": bad request: block=%llu, count=%u\n",
                        (unsigned long long)bio->bi_sector, bio->bi_size);
#if LINUX_VERSION_CODE < KERNEL_VERSION(2, 6, 24)//程序的兼容性
                bio_endio(bio, 0, -EIO);
#else
                bio_endio(bio, -EIO);
#endif
                return 0;
        }

        dsk_mem = simp_blkdev_data + (bio->bi_sector << 9);

  bio_for_each_segment(bvec, bio, i) {//bio由一个一个段构成,对于每个段要去进行相应处理
                void *iovec_mem;

                switch (bio_rw(bio)) {  //判断bio方向
                case READ:
                case READA:
                        iovec_mem = kmap(bvec->bv_page) + bvec->bv_offset;
  //kmap把页指针转换成地址加上偏移得到数据位于地址。
                        memcpy(iovec_mem, dsk_mem, bvec->bv_len);
                        kunmap(bvec->bv_page);
                        break;
                case WRITE:
                        iovec_mem = kmap(bvec->bv_page) + bvec->bv_offset;
                        memcpy(dsk_mem, iovec_mem, bvec->bv_len);
                        kunmap(bvec->bv_page);
                        break;
                default:
                        printk(KERN_ERR SIMP_BLKDEV_DISKNAME
                                ": unknown value of bio_rw: %lu\n",
                                bio_rw(bio));
#if LINUX_VERSION_CODE < KERNEL_VERSION(2, 6, 24)
                        bio_endio(bio, 0, -EIO);
#else
                        bio_endio(bio, -EIO);
#endif
                        return 0;
                }
                dsk_mem += bvec->bv_len;
        }

#if LINUX_VERSION_CODE < KERNEL_VERSION(2, 6, 24)
        bio_endio(bio, bio->bi_size, 0);
#else
        bio_endio(bio, 0);
#endif
        return 0;
}//没有request,直接拿到处理bio,绕过调度算法

struct block_device_operations simp_blkdev_fops = {
        .owner                = THIS_MODULE,
};

static int __init simp_blkdev_init(void)
{
        int ret;

        simp_blkdev_queue = blk_alloc_queue(GFP_KERNEL);//分配一个请求队列
        if (!simp_blkdev_queue) {
                ret = -ENOMEM;
                goto err_alloc_queue;
        }
        blk_queue_make_request(simp_blkdev_queue, simp_blkdev_make_request);
  //绑定make_request和请求队列,在simple-blk.c当有请求后,首先调用内核__make_request,然后调用自己提供的simp_blkdev_do_request,在本程序没有使用__make_rwquest有bio时,直接交给simp_blkdev_make_request,自己要实现其他调度算法,把bio按照自己方法处理形成一个request。
        simp_blkdev_disk = alloc_disk(1);
        if (!simp_blkdev_disk) {
                ret = -ENOMEM;
                goto err_alloc_disk;
        }

        strcpy(simp_blkdev_disk->disk_name, SIMP_BLKDEV_DISKNAME);
        simp_blkdev_disk->major = SIMP_BLKDEV_DEVICEMAJOR;
        simp_blkdev_disk->first_minor = 0;
        simp_blkdev_disk->fops = &simp_blkdev_fops;
        simp_blkdev_disk->queue = simp_blkdev_queue;
        set_capacity(simp_blkdev_disk, SIMP_BLKDEV_BYTES>>9);
        add_disk(simp_blkdev_disk);
  //填充gendisk并注册到内核
        return 0;

err_alloc_disk:
        blk_cleanup_queue(simp_blkdev_queue);
err_alloc_queue:
        return ret;
}


static void __exit simp_blkdev_exit(void)
{
        del_gendisk(simp_blkdev_disk);
        put_disk(simp_blkdev_disk);
        blk_cleanup_queue(simp_blkdev_queue);
}

module_init(simp_blkdev_init);
module_exit(simp_blkdev_exit);

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值