coding--open、fopen的差别

本文深入探讨了系统调用open与C函数fopen在文件操作中的应用区别,解释了两者如何实现无缓冲与带缓冲的io,并通过实例展示了两者在文件操作过程中的表现差异。重点阐述了标准库中的带缓存文件操作是如何通过自动分配内存与读取固定大小内容来提升效率,以及不带缓存的文件操作如何直接与系统调用交互,虽然速度可能不如带缓存操作,但在某些场景下仍具有不可忽视的优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

open是系统调用,对应无缓冲的io;fopen是C函数,对应缓冲的io,fopen会调用open实现。

程序中用openwrite打开创建并把“hello world“写入文件test.txt,相应用fopenfwrite操作文件test2.txt

程序执行到openfopen之后,sleep 15秒,这时用ls查看生成了文件没,这时用open打开的test.txt出现了,但是fopentest2.txt没有;

当程序执行完writefwrite之后,fopentest2.txt仍然没有出现(还是用ls查看),再用cattest.txt,可以看到 “helloworld”

最后再关闭test.txttest2.txt,这时test2.txt出现了,并且其内容也是“hello world”。

 

带缓存的文件操作是标准C库的实现,第一次调用带缓存的文件操作函数时标准库会自动分配内存并且读出一段固定大小的内容存储在缓存中。以后每次的读写操作并不是针对硬盘上的文件直接进行的,而是针对内存中的缓存的。何时从硬盘中读取文件或者向硬盘中写入文件有标准库的机制控制。不带缓存的文件操作通常都是系统提供的系统调用,更加低级,直接从硬盘中读取和写入文件,由于IO瓶颈的原因,速度并不如意,而且原子操作需要程序员自己保证,但使用得当的话效率并不差。另外标准库中的带缓存文件IO 是调用系统提供的不带缓存IO实现的。

“术语不带缓冲指的是每个read和write都调用内核中的一个系统调用。所有的磁盘I/O都要经过内核的块缓冲(也称内核的缓冲区高速缓存),唯一例外的是对原始磁盘设备的I/O。既然read或write的数据都要被内核缓冲,那么术语“不带缓冲的I/O“指的是在用户的进程中对这两个函数不会自动缓冲,每次read或write就要进行一次系统调用。“

--------摘自<unix环境编程>

 

### 如何在不同环境或语言中设置UTF-8编码 #### 在Linux环境中设置UTF-8编码 在Linux系统中,可以通过调整`locale`来设置UTF-8编码。使用命令`locale charmap`可以查询当前语言环境中的字符编码名称[^1]。如果需要确保系统使用UTF-8编码,可以通过以下方法设置: 1. **检查当前语言环境**:运行`locale`命令查看当前的locale设置。 2. **安装UTF-8支持的语言环境**:如果未安装UTF-8语言环境,可以使用`locale -m`列出所有已安装的字符编码,并通过包管理器安装所需的UTF-8语言环境。 3. **修改环境变量**:将`LC_ALL`或`LANG`设置为带有UTF-8的值,例如`en_US.UTF-8`。可以在`.bashrc`或`.profile`文件中添加以下内容: ```bash export LC_ALL=en_US.UTF-8 export LANG=en_US.UTF-8 ``` #### 在C语言中生成UTF-8编码格式的文件 在C语言中生成UTF-8编码格式的文件时,需要确保程序正确处理多字节字符。以下是实现方法: 1. **设置正确的文件编码**:在写入文件时,确保文件流以二进制模式打开,避免字符被转换。 2. **使用宽字符支持**:利用标准库函数如`fputws`和`fwprintf`来处理Unicode字符。例如: ```c #include <stdio.h> #include <wchar.h> #include <locale.h> int main() { setlocale(LC_ALL, "en_US.UTF-8"); // 设置UTF-8 locale wchar_t str[] = L"你好,世界!"; // 宽字符字符串 FILE *file = fopen("output.txt", "wb"); // 以二进制模式打开文件 if (file) { fputws(str, file); // 写入宽字符字符串 fclose(file); } return 0; } ``` #### 在Python中设置UTF-8编码 在Python中,可以通过以下方式确保程序使用UTF-8编码: 1. **设置源码编码**:在文件顶部添加`# -*- coding: utf-8 -*-`声明。 2. **读写文件时指定编码**:使用`open`函数时指定`encoding='utf-8'`参数。例如: ```python with open('output.txt', 'w', encoding='utf-8') as file: file.write("你好,世界!") ``` #### 在Web开发中设置UTF-8编码 在Web开发中,确保HTML页面和服务器响应使用UTF-8编码: 1. **HTML页面**:在`<head>`标签中添加`<meta charset="UTF-8">`。 2. **HTTP响应头**:设置`Content-Type`为`text/html; charset=UTF-8`。 #### 在数据库中设置UTF-8编码 对于MySQL等数据库,可以通过以下方式设置UTF-8编码: 1. **创建数据库时指定字符集**:`CREATE DATABASE mydb CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;` 2. **连接数据库时指定字符集**:在连接字符串中添加`charset=utf8mb4`。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值