数据解析、验证与并发编程实践
1. 自定义数据格式解析
在处理数据时,有时会遇到没有现成库支持的数据格式,这时就需要编写自定义解析器。Clojure 及大多数函数式语言在解析方面表现出色,许多都有解析器组合库,使编写解析器变得极为简单。
1.1 FASTA 数据解析示例
FASTA 是生物信息学中用于交换核苷酸和肽序列的文件格式。其第一行以 > 开头,后跟唯一标识符,后续一行或多行列出序列信息。示例 FASTA 记录如下:
>gi|5524211|gb|AAD44166.1| cytochrome b [Elephas maximus maximus]
LCLYTHIGRNIYYGSYLYSETWNTGIMLLLITMATAFMGYVLPWGQMSFWGATVITNLFSAIPY
IGTNLVEWIWGGFSVDKATLNRFFAFHFILPFTMVALAGVHLTFLHETGSNNPLGLTSDSDKIP
FHPYYTIKDFLGLLILILLLLLLALLSPDMLGDPDNHMPADPLNTPLHIKPEWYFLFAYAILRS
VPNKLGGVLALFLSIVILGLMPFLHTSKHRSMMLRPLSQALFWTLTMDLLTLTWIGSQPVEYPY
TIIGQMASILYFSIILAFLPIAGXIENY
我们将使用 parse-ez 库来构建解析器。
1.2 准备工作
确保在 Leiningen 项目的 pr
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



