
生物
文章平均质量分 59
msw521sg
这个作者很懒,什么都没留下…
展开
-
说说基因组的垃圾DNA-Transposable elements
Transposable elements(TE)即转座元件在真核生物基因组中非常常见,小麦基因组更是含有高达85%的转座元件或重复序列。转座元件在玉米中第一次被发现,开始认为转座元件是基因组的垃圾,不行使功能,随着研究的深入,转座元件在基因组进化、基因表达表达调控方面具有重要作用。 上篇博文中提到一篇paper发现基因启动子区域(包括5’非翻译区)MITE插入可以影响基因表达。这篇paper原创 2016-09-08 09:29:05 · 6008 阅读 · 0 评论 -
如何获取一个基因家族的所有小麦基因
如何获取一个基因家族的所有小麦基因昨天有同学问我如何获得谷子中一个基因家族的所有基因。谷子已经测过序,获得起来还是比较简单。想要获得一个基因组家族的所有基因,方法很多。比方说,IWGSCv1.0的基因功能注释文件里就可以直接搜索相关关键词或者蛋白domain的ID等获取。结合基因家族序列特点,合理选择获取方法。有的基因家族成员之间保守性不好,可能官方给的注释里边不是全。下面说一下如何在线获取基于TG原创 2017-08-03 09:43:34 · 16004 阅读 · 3 评论 -
NCBI推出blastp加速服务(Accelerated protein-protein BLAST)
NCBI推出blastp加速服务(Accelerated protein-protein BLAST) 很多时候会用到NCBI在线blastp的nr库,随着nr库越来越大,速度也越来越慢。这不在今年5月份的时候推出了blastp加速工具。使用非常简单,blastp页面中在Program Selection一项中选择Quick BLASTP(见下图)。现在已经是默认选项。原创 2017-06-29 17:00:14 · 3355 阅读 · 0 评论 -
基于RNA-seq的基因表达分析
我的青春 最近在做一些小麦基因的表达分析,想到使用RNA-seq的数据进行生物信息学分析,并且比我做实验用的组织还要多。 下载数据之后,首先要对数据进行低质量序列和载体序列等污染序列去除,我这里结合了两个软件AdapterRemoval和bbduk2, bbduk2是bbmap中的一个子程序。AdapterRemoval --file1 input1.fastq.gz --fil原创 2016-09-23 14:53:17 · 16277 阅读 · 0 评论 -
利用一个核雄性不育基因构建杂交水稻雄性不育系统
利用一个核雄性不育基因构建杂交水稻雄性不育系统 邓兴旺院士和唐晓艳教授领衔的深圳作物分子设计研究院近日在《美国国家科学院院报》(PNAS)上发表论文<<利用一个核雄性不育基因构建杂交水稻雄性不育系统>>(Construction of a male sterility system for hybrid rice breeding and seed production using a nucle原创 2016-11-22 09:53:27 · 3734 阅读 · 0 评论 -
从基因组注释说起
N年前测序还是问题,基因组的解读排在后边,现如今,测序已然不是问题, 成百上千的基因组被测序,这么多的基因组需要解读还真不是件容易的事。以前高大上的工作,注定要飞入寻常百姓家。开发出易用且准确度高的注释工具就很迫切了。 首先来说说编码蛋白基因的注释。真核生物的基因往往具有内含子,不像原核生物那样方便对于编码基因的注释现在有很多工具了,今天要说的是maker-P这款工具,当然这款工具内置了几款基原创 2016-09-30 23:34:21 · 6882 阅读 · 0 评论 -
神器BBMap
今天碰到一款神器,即BBMap suit. JAVA编写的一套生物信息学工具,可以适用于各种平台。主要是用来进行短序列比对的,但是不仅仅是短序列比对,还有其他很多吊炸天的功能。不仅能够快速比对短序列,还能比对PacBio,454的序列。除了做序列比对和mapping,还有一些非常实用的功能。BBNorm, Dedupe,Reformat,BBduk等工具,下面分别来介绍。 首先,说下为啥叫B原创 2016-09-17 22:04:17 · 13508 阅读 · 1 评论 -
EST数据分析
一、EST数据来源 本研究所用的小麦EST数据库来自GenBank数据库(截止2013年12月),共1286914条序列二、低质量序列部分以及污染序列去除 通过逐条扫描EST序列去掉EST序列中低质量部分。具体步骤为,从5'端开始向3'端扫描每一条EST序列,如果在10bp长度范围内出现两次以上除'A','T','C','G'外的字符,则将该10bp序列以原创 2016-09-17 11:36:06 · 5807 阅读 · 0 评论 -
从maker-P结果中筛选完整CDS
>maker-lcl|TGACv1_scaffold_433174_5DL_UN109209-exonerate_est2genome-gene-0.0-mRNA-1 transcript offset:19 AED:0.00 eAED:0.00 QI:19|1|1|1|0|0|3|270|77GGATGTTGCTACTTGCTAGATGGAAATGGAAACATGCAAGTTGGAACTTCC原创 2016-09-17 11:31:29 · 1105 阅读 · 0 评论 -
GMAP gff3格式转换与数据统计
##gff-version 3# Generated by GMAP version 2016-06-09 using call: gmapl.sse42 -D /export/data/ -d NRGenome --trim-end-exons=10 -t 32 --canonical-mode=2 --allow-close-indels=2 -B 4 -f 4 -n 0 ./unig原创 2016-09-17 11:24:52 · 2278 阅读 · 0 评论 -
体外应用Cas9系统实现对上百kb的基因组片段的靶向克隆
2015年的时候看到这样篇论文,了解到Cas9可以进行体外酶切。清华大学生命科学学院朱听研究员课题组在《自然-通讯》上在线发表了题为《CATCH技术实现大型基因簇一步法靶向克隆》(Cas9-Assisted Targeting of Chromosome segments CATCH enables one-step targeted cloning of large gene clusters)的原创 2017-08-07 09:45:04 · 1818 阅读 · 0 评论