2、文件流处理与固定宽度文件读取

fox11

于 2025-11-14 10:56:38 发布

阅读量2

点赞数

CC 4.0 BY-SA版权

分类专栏：用Ruby解锁文本的力量文章标签：文件流处理固定宽度文件逐行读取

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/fox11/article/details/155544791

用Ruby解锁文本的力量专栏收录该内容

22 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

文件流处理与固定宽度文件读取

1. 以流的方式处理文件

在处理文件时，将整个文件内容一次性读入内存并非总是最佳解决方案。对于小文件而言，这可能只是造成内存浪费；但对于大文件，这可能根本无法实现。例如，在只有 4GB 内存的计算机上处理一个 50GB 的文件，显然无法一次性读取整个文件。

解决方案是将文件视为流。我们可以每次只读取一小部分内容，而不是一次性从文件开头读到结尾并将所有信息存储在内存中。比如，我们可以逐行读取文件，读完一行后将其丢弃，再读取下一行，直到文件末尾；也可以逐个字符或逐个单词进行读取。关键在于，任何时候我们都不会将整个文件存储在内存中，而只是存储正在处理的那一小部分。

这种方式使我们能够处理巨大的文件（必要时可达数 GB），而无需消耗接近文件大小的内存。通过调整“逐块”读取的方式，我们还可以根据文件的结构来遍历文件。如果文件有多行，每行代表一条记录，我们可以逐行读取；如果文件是一行巨大的文本，但字段由逗号分隔，我们可以每次读取到下一个逗号，逐字段处理文本。

1.1 逐行流式处理文件

以 Web 服务器日志为例，我们只输出来自特定 IP 地址的请求。使用流式处理的解决方案非常简单，甚至比将整个文件读入内存的方法更简便。

文件对象有一个 each_line 方法，该方法接受一个代码块，并逐行遍历文件，为每行执行一次该代码块。以下是示例代码：

File.open("access_log") do |log_file|
  log_file.each_line do |request|
    if

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。