Rust 文本处理:解析、提取与处理的综合实践
1. 解析 TSV 文件与参数互斥性
在解析 TSV 文件时,默认使用制表符(字节值为 9)作为分隔符。例如:
$ cargo run -- -f 2-3 tests/inputs/movies1.tsv
Config {
files: [
"tests/inputs/movies1.tsv",
],
delimiter: 9,
extract: Fields(
[
1..3,
],
),
}
需要注意的是, -f|--fields 、 -b|--bytes 和 -c|--chars 这些选项应该是互斥的。若同时使用,会出现错误:
$ cargo run -- -f 1 -b 8-9 tests/inputs/movies1.tsv
error: The argument '--fields <FIELDS>' cannot be used with '--bytes <BYTES>'
程序应能通过所有验证输入有效性的测试,可使用 cargo test dies 运行这些测试。
2. 解析位置列表
parse_pos 函
超级会员免费看
订阅专栏 解锁全文
44

被折叠的 条评论
为什么被折叠?



