正在加载
请稍等

菜单

红楼飞雪 梦

15526773247

文章

Home 块设备驱动程序的几个函数
Home 块设备驱动程序的几个函数

块设备驱动程序的几个函数

未分类 by

 

所有对块设备的读写都是调用generic_file_read ( )和generic_file_write ( ) 函数,这两个函数的原型如下:

ssize_t generic_file_read(struct file * filp, char * buf, size_t count, loff_t    *ppos)
ssize_t   generic_file_write(struct file *file,const char *buf,size_t count, loff_t  *ppos)

其参数的含义如下:filp:和这个设备文件相对应的文件对象的地址。

  • Buf:用户态地址空间中的缓冲区的地址。generic_file_read()把从块设备中读出的数据写入这个缓冲区;反之,generic_file_write()从这个缓冲区中读取要写入块设备的数据。
  • Count:要传送的字节数。
  • ppos:设备文件中的偏移变量的地址;通常,这个参数指向filp->f_pos,也就是说,指向设备文件的文件指针。

只 要进程对设备文件发出读写操作,高级设备驱动程序就调用这两个函数。例如,superformat程序通过把块写入/dev/fd0设备文件来格式化磁 盘,相应文件对象的write方法就调用generic_file_write()函数。这两个函数所做的就是对缓冲区进行读写,如果缓冲区不能满足操作 要求则则返回负值,否则返回实际读写的字节数。每个块设备在需要读写时都调用这两个函数。

下面介绍几个低层被频繁调用的函数。

1、bread( )和breada( ) 函数

bread( )函数检查缓冲区中是否已经包含了一个特定的块;如果还没有,该函数就从块设备中读取这个块。文件系统广泛使用bread( )从磁盘位图、索引节点以及其他基于块的数据结构中读取数据。(注意当进程要读块设备文件时是使用函数generic_file_read()函数,而不 是使用bread( )函数。)该函数接收设备标志符、块号和块大小作为参数,其代码在fs/buffer.c中:

/**
 *      bread() - reads a specified block and returns the bh
 *      @block: number of block
 *      @size: size (in bytes) to read
 *
  *      Reads a specified block, and returns buffer head that
  *      contains it. It returns NULL if the block was unreadable.
  */
struct buffer_head * bread(kdev_t dev, int block, int size)
{
    struct buffer_head * bh;
    bh = getblk(dev, block, size);
    touch_buffer(bh);
    if (buffer_uptodate(bh))
        return bh;
    ll_rw_block(READ, 1, &bh);
    wait_on_buffer(bh);
    if (buffer_uptodate(bh))
        return bh;
    brelse(bh);
    return NULL;
}

对该函数解释如下:

  • 调用getblk( )函数来查找缓冲区中的一个块;如果这个块不在缓冲区中,那么getblk( )就为它分配一个新的缓冲区。
  • 调用buffer_uptodate()宏来判断这个缓冲区是否已经包含最新数据,如果是,则getblk( )结束。
  • 如果缓冲区中没有包含最新数据,就调用ll_rw_block( )函数启动读操作。
  • 等待,直到数据传送完成为止。这是通过调用一个名为wait_on_buffer( )的函数来实现的,该函数把当前进程插入b_wait等待队列中,并挂起当前进程直到这个缓冲区被开锁为止。

breada( )和bread( )十分类似,但是它除了读取所请求的块之外,还要另外预读一些其他块。注意不存在把块直接写入磁盘的函数。写操作永远都不会成为系统性能的瓶颈,因为写操作通常都会延时。

2、ll_rw_block( )函数

ll_rw_block( )函数产生块设备请求;内核和设备驱动程序的很多地方都会调用这个函数。该函数接原型如下:

void ll_rw_block(int rw, int nr, struct buffer_head * bhs[])

其参数的含义为:

  • 操作类型rw,其值可以是READ、WRITE、READA或者WRITEA。最后两种操作类型和前两种操作类型之间的区别在于,当没有可用的请求描述符时后两个函数不会阻塞。
  • 要传送的块数nr。
  • 一个bhs数组,有nr个指针,指向说明块的缓冲区首部(这些块的大小必须相同,而且必须处于同一个块设备)。

该函数的代码在block/ll_rw_blk.c中:

void ll_rw_block(int rw, int nr, struct buffer_head * bhs[])
{
    unsigned int major;
    int correct_size;
    int i;
    if (!nr)
        return;
    major = MAJOR(bhs[0]->b_dev);
    /* Determine correct block size for this device. */
    correct_size = get_hardsect_size(bhs[0]->b_dev);
    /* Verify requested block sizes. */
    for (i = 0; i < nr; i++)
    {
        struct buffer_head *bh = bhs[i];
        if (bh->b_size % correct_size)
        {
            printk(KERN_NOTICE "ll_rw_block: device %s: "
                   "only %d-char blocks implemented (%u)\n",
                   kdevname(bhs[0]->b_dev),
                   correct_size, bh->b_size);
            goto sorry;
        }
    }
    if ((rw & WRITE) && is_read_only(bhs[0]->b_dev))
    {
        printk(KERN_NOTICE "Can't write to read-only device %s\n",
               kdevname(bhs[0]->b_dev));
        goto sorry;
    }
    for (i = 0; i < nr; i++)
    {
        struct buffer_head *bh = bhs[i];
        /* Only one thread can actually submit the I/O. */
        if (test_and_set_bit(BH_Lock, &bh->b_state))
            continue;
        /* We have the buffer lock */
        atomic_inc(&bh->b_count);
        bh->b_end_io = end_buffer_io_sync;
        switch(rw)
        {
        case WRITE:
            if (!atomic_set_buffer_clean(bh))
                /* Hmmph! Nothing to write */
                goto end_io;
            __mark_buffer_clean(bh);
            break;
        case READA:
        case READ:
            if (buffer_uptodate(bh))
                /* Hmmph! Already have it */
                goto end_io;
            break;
        default:
            BUG();
end_io:
            bh->b_end_io(bh, test_bit(BH_Uptodate, &bh->b_state));
            continue;
        }
        submit_bh(rw, bh);
    }
    return;
sorry:
    /* Make sure we don't get infinite dirty retries.. */
    for (i = 0; i < nr; i++)
        mark_buffer_clean(bhs[i]);
}

下面对该函数给予解释:

进入ll_rw_block()以后,先对块大小作一些检查;如果是写访问,则还要检查目标设备是否可写。内核中有个二维数组ro_bits,定义于drivers/block/ll_rw_blk.c中:

static long ro_bits[MAX_BLKDEV][8];

每个设备在这个数组中都有个标志,通过系统调用ioctl()可以将一个标志位设置成1或0,表示相应设备为只读或可写,而is_read_only()就是检查这个数组中的标志位是否为1

接 下来,就通过第二个for循环依次处理对各个缓冲区的读写请求了。对于要读写的每个块,首先将其缓冲区加上锁,还要将其buffer_head结构中的函 数指针b_end_io设置成指向end_buffer_io_sync,当完成对给定块的读写时,就调用该函数。此外,对于待写的缓冲区,其 BH_Dirty标志位应该为1,否在就不需要写了,而既然写了,就要把它清0,并通过__mark_buffer_clean(bh)将缓冲区转移到干 净页面的LRU队列中。反之,对于待读的缓冲区,其buffer_uptodate()标志位为0,否在就不需要读了。每个具体的设备就好像是个服务器, 所以最后具体的读写是通过submit_bh()将读写请求提交各“服务器”完成的,每次读写一个块,该函数的代码也在同一文件中,读者可以自己去读。

 

30 2015-11

 

我要 分享

 

 

本文 作者

 

相关 文章