3、Ruby 文件读取与标准输入处理全解析-优快云博客

本文链接：https://blog.youkuaiyun.com/grafana8visual/article/details/155629803

Ruby 文件读取与标准输入处理全解析

1. 文件读取的注意事项

在进行文件读取操作时， read 和 seek 方法是基于字节层面而非字符层面进行工作的。这一点非常关键，尤其是当你使用多字节字符编码（如 UTF - 8）时。如果不小心使用 seek 方法，可能会使指针停留在一个多字节字符的中间位置，这样在后续读取数据时就会得到乱码。

因此，只有在以下两种情况下，你才应该使用这些方法：
- 处理的完全是单字节字符。
- 你能确定要查找的位置不会处于字符的中间，就像在处理温度数据示例中，我们查找的是记录之间的边界。

尽管 seek 方法存在这样的局限性，但使用固定宽度文件仍有很大的好处。无论文件有多大，我们都可以在不读取任何不必要数据的情况下检索任何值，实现对文件内数据的随机访问。例如，要检索第 10 条记录，我们只需从文件开头查找 567 个字节；要检索第 703 条记录，只需从文件开头查找 44,226 个字节，依此类推。而且，无论文件变得多大，这个操作所花费的时间都是相同的，即使文件有数百兆字节的数据。这就是为什么有时我们值得忍受这种文件格式的局限性，因为它既简单又快速。

下面通过一个 mermaid 流程图来展示文件读取的大致流程：

graph TD;
    A[打开文件] --> B[判断是否使用seek];
    B -- 是 --> C{是否为单字节字符或查找位置合理};
    C -- 是 --> D[