
生物信息
文章平均质量分 81
探索者v
这个作者很懒,什么都没留下…
展开
-
【一起学生信】认识MAPQ
目录MAPQ 定义MAPQ的影响因素欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导...原创 2019-04-15 01:22:20 · 5289 阅读 · 0 评论 -
【一起学生信】根据reads名称提取bam
上文(https://lipidong.blog.youkuaiyun.com/article/details/88975801) 提到了根据参考基因组的位置来提取bam信息,根据基因组区域来提取其实是比较容易的,即便没有现成的软件我们将bam排序后,用awk也可以快速提取,但是如果是根据reads名称来提取就比较麻烦了,自己写脚本或者用grep速度会比较慢,今天推荐用picard来操作。java -ja...原创 2019-04-02 16:56:49 · 5685 阅读 · 4 评论 -
【一起学生信】根据目标区域提取bam信息
测序完成得到的reads我们会比对到参考基因组得到bam文件,bam文件一般很大,很多时候我们只需要提取部分内容。根据参考基因组位置提取根据指定基因组区域的提取bam,可以使用以下命令。samtoolssamtools view -hb chr:start-end wgs.sort.bam > target.region.bam# 根据bed文件来提取samtools vie...原创 2019-04-02 16:49:44 · 20800 阅读 · 1 评论 -
【测序发展史】一代、二代、三代测序发展
转自: https://mp.weixin.qq.com/s?__biz=MzI5MTcwNjA4NQ==&mid=2247487425&idx=1&sn=855a6f72cfa78840157aa87b68ce36f4&chksm=ec0dca4bdb7a435d178c2ac72a3ff78170951812f80ba3b3fae78...转载 2018-12-06 19:55:24 · 7610 阅读 · 2 评论 -
【深入UCSC Genome Browser】repeats-RepeatMasker
RepeatMasker 是 UCSC Genome Browser的一个track,位于repeats模块。RepeatMasker(http://www.repeatmasker.org/)是Arian Smit等人开发的程序,可以筛选DNA序列中的散在重复序列( interspersed repeats)和低复杂序列(low complexity DNA sequences),类型主要包...原创 2018-07-08 13:38:58 · 11781 阅读 · 0 评论 -
【深入UCSC Genome Brower】他山之石
转自:https://mp.weixin.qq.com/s?__biz=MzAwMzY4MTYxNw==&mid=2655752921&idx=1&sn=159f79dde58d2145c59307e23a06b97a&scene=0#wechat_redirect这是一个神奇的网站:UCSC Genome Brower有朋友在后台留言让介绍下UCSC Genome...转载 2018-07-08 13:22:52 · 4658 阅读 · 0 评论 -
【深入UCSC Genome Brower】写在前面
UCSC Genome Database(http://genome.ucsc.edu/)是加州大学圣克鲁兹分校(UCSC)创立和维护的一个重要的生物学数据库,它包含了大量基因组数据,基因组间的比对信息, 参考序列(mRNA, EST )、基因注释信息(ENCODE )、表型、表达谱、调控信息、保守性、变异、重复区域等一系列信息UCSC 数据库提供了可视化工具 Genome Browser 去...原创 2018-07-08 13:08:02 · 1576 阅读 · 0 评论 -
【一起学生信】blast 结果文件处理
本地采用blast比对完成后,会得到一个xml文件,但是xml文件过于复杂,不好处理。我们可以采用biopython将其转换为 blast-tab 文件。from Bio import SearchIOxml = SearchIO.parse('/your/xml-path/', 'blast-xml')SearchIO.write(xml, '/your/output-path', 'bla原创 2018-01-04 11:46:53 · 5806 阅读 · 0 评论 -
【一起学生信】bam文件统计覆盖深度、靶向捕获效率
bam文件统计覆盖深度、靶向捕获效率是在基因组测序分析中经常用到的操作,之前也用过python、perl实现过但是速度比较慢,今天偶然发现了一个软件bamdst(https://github.com/shiquan/bamdst), 采用c语言编写,速度快,分析的类型也比较多,涉及到了mapping统计、靶向捕获统计、flanking区域统计、深度覆盖统计等。用起来比较方便,具体使用可以参考git原创 2018-01-02 18:23:08 · 12751 阅读 · 1 评论 -
基因组组装算法
基因组组装算法目前,构建Graph的主流方法有3种,Overlap-Layout-Consensus(Celera Assembler、PBcR),de Bruijn Graph(SOAPdenovo ) 和 String Graph(Falcon)。相关文献基于De Bruijn图的宏基因组序列组装算法研究(CNKI)对基因组组装算法的分析和研究(CNKI)基于De Bruijn图的De Nov转载 2017-12-04 13:28:58 · 6656 阅读 · 0 评论