Ruby 编码处理:从文件操作到脚本优化
1. Ruby 文件操作中的编码变化
在处理更复杂的需求或编写二进制文件时,Ruby 1.9 改变了 File.open() 中 "rb" 和 "wb" 的含义。使用这些文件模式不仅会禁用行尾转换,还会默认将外部编码设置为 ASCII-8BIT 。例如,在 Prawn 的 Document#render_file 方法中就使用了这种方式:
class Prawn::Document
# ...
def render_file(filename)
File.open(filename,"wb") { |f| f << render }
end
end
在使用文件时,采用这种多语言支持(m17n)策略需要注意以下几点:
- 除非处理二进制文件,否则要明确指定文件的外部编码,并在读写时将其转换为 UTF - 8。
- 处理二进制文件时,要使用 File.binread() 或在 File.open() 中使用正确的标志,避免文本被意外编码成本地字符集。
2. 有序转码用户输入
在处理用户输入时,需要决定哪些内容需要转码以及在何处进行转码。Prawn 采用了极简主义的方法。虽然期望最终用户提供 UTF - 8 编码的字符串,但许多涉及简单比较的功能无需转码即可工作。 </
超级会员免费看
订阅专栏 解锁全文
168万+

被折叠的 条评论
为什么被折叠?



