大多数摘抄自APUE,部分个人理解可能有错误,谢谢~
每个打开的文件,都有与之相关的当前文件偏移量。读、写操作都从当前文件偏移量开始。使用lseek函数可以指定文件偏移量,函数如下:
#include<unistd.h>
off_t lseek(int fd, off_t offset, int whence);
//如果成功,返回新的文件偏移量,失败返回-1
whence(第三个参数)三种设定:
- SEEK_SET(0),则该文件的偏移量设置为距离文件开始处offset个字节。(offset必须为正)
- SEEK_CUR(1),则将该文件偏移量设为当前值加上offset,offset可正可负。
- SEEK_END(2),则将该文件的偏移量设置为文件长度加offset,offset可正可负。
对普通文件来说,当前文件偏移量(不是offset)必须是非负值。如下代码所示:
#include<unistd.h>
#include<fcntl.h>
#include<stdio.h>
int main()
{
int fd;
if( (fd = open("test.cpp",O_RDWR) )== -1)
{
printf("open error");
return -1;
}
off_t currentPos;
if((currentPos = lseek(fd,5,SEEK_CUR)) == -1)
{
printf("cannot seek");
return -1;
}
printf("%s%ld\n","change 0 to 5,offset is 5,currentPos is:",currentPos);
if((currentPos = lseek(fd,-2,SEEK_CUR)) == -1)
{
printf("cannot seek");
return -1;
}
printf("%s%ld\n","change 5 to 3,offset is -2,currentPos is:",currentPos);
if((currentPos = lseek(fd,-4,SEEK_CUR)) == -1)
{
printf("cannot seek\n");
return -1;
}
}
输出结果:
lseek不引起IO操作,仅仅是将当前文件偏移量记录到内核中。如下图所示(图源APUE):
每个进程都有一张打开文件描述符表(图中左侧),每个描述符占一项,每项中有文件描述符标志以及一个指向文件表项(图中中间)的指针。
文件表项包括:
- 文件状态标志(读、写等等)
- 当前文件偏移量
- 指向文件v节点的指针
如果有多个进程打开同一个文件,每个进程会获得各自的文件表项,因此每个进程可以设定自己的当前文件偏移量。但是文件的v节点结构只有一个。这样就带来了如下问题:
当A进程打开某一文件想要向文件结尾处继续写入时,先调用lseek,将A进程中对应文件的当前文件偏移量设为当前文件的尾端(假设:1500字节处)。之后内核切换进程,B进程运行。B进程也调用lseek将B进程中对应的当前文件偏移量设置为1500字节处,之后调用write写入,增加至1600字节,对应的v节点中文件长度也修改为1600字节。
内核切换回到A进程,A进程调用wrtie,仍然从1500字节处开始写入,覆盖了B写入的数据。
所以,要把设置文件偏移量和写入捏合成一个原子操作,不能在中间被打断。O_APPEND实现了这一要求,在内核每次写操作之前,都将文件偏移量设置到文件末尾处,写之前不用调用lseek,于是上述情况就不会发生。