(首发地址:学习日记 如何打开和编辑超大(8.4G)TAB 分隔的 TCGA(癌症基因图谱)文本文件 – 学习日记 )
本文示例怎样打开和编辑一个超大 TCGA(癌症基因图谱)文本数据文件(8.4G)。包括检测文件信息、处理成每 1000 行一个的小文件。使用的命令有:wc、sed、head、split等。查看命令 less,编辑器 vim、Sublime Text、Atom、UltraEdit。最后着重介绍一个可以直接打开单独原始文件的软件 CSView。示范平台: i7 4770 CPU,16G内存,Deepin 20.9 Linux。演示视频:
如何打开和编辑超大(8.4G)TAB 分隔的 TCGA(癌症基因图谱)文本文件
一、TCGA 数据
下载:

本文介绍了如何在Linux环境下处理一个8.4GB的TCGA基因图谱文本文件,涉及文件检测、分割成小文件、使用less查看、编辑器选择(如vim和UltraEdit)以及推荐的跨平台软件CSView。作者还提到了内存优化的问题和解决方法。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



