- 博客(52)
- 收藏
- 关注
原创 机器学习系列之框架选择
本人使用python语言编程,且目前主流的机器学习框架都是基于python的。所以,选择起来就在top里面的框架选择。虽然有很多新的学习框架出来,但是目前大家用的最多,资料最齐全的还是Tensorflow,所以楼主打算从这个开始学习。经过半年时间,发现新出的pytorch好像更好些,继续学习
2017-07-28 15:50:04
464
转载 DISCOVAR的使用说明
1. DISCOVAR简介DISCOVAR 是有 ALLPATHS-LG 软件开发团队做出来的软件。主要用于利用 PE 250bp 数据与参考基因组的比对结果,对基因组进行 Variants calling 的同时,进行基因组的组装。特别是近期公布的 DISCOVAR de novo (experimental) 还能进行基因组的 De novo 组装。2. DISCOVAR的下载和安
2015-02-26 12:35:21
1224
转载 用R制作渐变背景图片
library(jpeg)## 先用barplot函数产生一张JPG图片,默认背景为白色img <- "result.jpg"jpeg(img, width = 300, height = 300)barplot(sample(1:100, 10))dev.off()## 读取图片x <- readJPEG(img)dimx <- dim(x)n <- dimx[1] * dim
2015-02-26 12:31:24
1068
转载 文章投稿必看
一、最初投稿Cover letterDear Editors:We would like to submit the enclosed manuscript entitled “Paper Title”, which we wish to be considered for publication in “Journal Name”. No conflict of interest exi
2015-02-15 11:22:13
1290
原创 欧洲人浅色皮肤源自一万年前一祖先基因突变
—————————————————————————————————————————————————————爱美的妹纸,你的SLC24A5基因是什么情况呀?欧洲人的SLC24A5基因在染色体15的比例上占了约0.0072,非洲等地人的SLC24A5基因则占据了0.175-0.226.—————————————————————————————————————————————————————
2015-02-14 21:52:19
1549
原创 同源基因查找软件OrthoMCL的使用
OrthoMCL (http://orthomcl.org/orthomcl/)主要用来找直系同源基因以及旁系同源基因。它主要在比较完整的基因组之间找直系同源基因。OrthoMCL的使用主要13步,可以参考doc/OrthoMCLEngine/Main/UserGuide.txt。为了方便运行OrthoMCL,可以建立一个工作目录“my_orthomcl_dir”。1>配置OrthoMCL程序
2015-02-14 21:49:44
12422
1
原创 测序帮--一个不错的测序论坛
最近发现了一个做的不错的测序论坛--测序帮,界面美观,操作很方便。各种功能也蛮新颖的,喜欢测序和分析的同学不如去看看,也行就是你喜欢的。给个链接:www.ngs-assist.com
2015-02-14 19:15:46
1792
原创 大数据课程培训
发现了一个很不错的大数据课程网站,大家有兴趣的可以去学习下haishenruo分享了炼数成金邀请码,使用邀请码报名课程可以减免50%固定学费哦!http://edu.dataguru.cn/invite.php?invitecode=BG25
2015-01-15 13:48:03
1028
转载 如何成为0级生物信息学者
如何成为0级生物信息学者2014-12-1 16:29| 发布者: 小小测序君| 查看: 182| 评论: 0|来自: 科学网摘要: 昨天到广州参加广东省高性能计算学会2014年会暨第三届基于高性能计算的生物医药应用研讨会及CAE专委会成立会......嗨,这会议名称也真够长的。还是会议主题简洁有力,计算决定未来,我现在很认同。为啥呢?从成都出 ...
2014-12-02 08:47:49
1459
原创 推荐一个好用的笔记
推荐使用为知笔记(WizNote),它是电脑、手机、平板上都能用的云笔记软件,还可以分类管理和共享资料,使用我的邀请码注册:https://note.wiz.cn/i/6c30cfce
2014-09-12 09:19:34
864
转载 TALEN、ZFN以及CRISPR/Cas
新一代位点特异性基因组工程学利器——TALEN、ZFN以及CRISPR/Cas ...2014-4-29 21:09| 发布者: slytjiaofei| 查看: 95| 评论: 0|来自: 生物360摘要: 前言 转录激活样效应因子核酸酶(transcription activator-like effector nuclease, TALEN)技术与锌指核酸酶(
2014-04-30 13:20:54
12858
转载 Tophat-fusion Manual
ManualBeginning users should take a look at the Getting started guide for a tutorial on running TopHat-Fusion.How to use fusion mappingAfter running tophat, you can run tophat-fusi
2014-04-30 10:57:17
4134
转载 测序发展小结
摘要:从1977年第一代DNA测序技术(Sanger法)1,发展至今三十多年时间,测序技术已取得了相当大的发展,从第一代到第三代乃至第四代,测序读长从长到短,再从短到长。虽然就当前形势看来第二代短读长测序技术在全球测序市场上仍然占有着绝对的优势位置,但第三和第四代测序技术也已在这一两年的时间中快速发展着。测序技术的每一次变革,也都对基因组研究,疾病医疗研究,药物研发,育种等领域产生巨大的推动作用。
2014-04-11 15:01:46
8581
原创 推荐一个文献管理工具--Paperbox
向大家推荐一个文献管理工具,paperbox,这款软件有很多自己的特点,个人认为最有用的就是它的文献侦测功能,可以根据用户提供的关键词侦测最新发表的文章。软件下载地址:http://www.paper-box.co/?ref=haishenruo
2014-03-31 16:25:02
2841
原创 Perl--寻找两个基因组中的unique序列
原始数据:基因组的fasta文件,两个基因组之间blast的比对坐标scaffold1 27239022 contig00005238996 1scaffold1 2102621305 contig00005220604 220885scaffold1 1813818419 contig00005217718 217997scaffold1 224366
2014-03-20 08:42:13
1832
转载 BioPerl--SeqIO
Bio::SeqIO处理fasta和fastq文件 (2012-07-05 11:12:41)转载▼标签: bioperl seqio分类: BioinformaticsBioperl里提供的Bio::SeqIO包可以帮助我们很方便地处理fasta和fastq等文件。==============
2014-03-18 15:04:06
3522
转载 Linux--tar打包
如何使用tar命令使tar打包多个文件标签:tar 压缩tar -c: 建立压缩档案 -x:解压 -t:查看内容 -r:向压缩归档文件末尾追加文件 -u:更新原压缩包中的文件 这五个是独立的命令,压缩解压都要用到其中一个,可以和别的命令连用但只能用其中一个。下面的参数是根据需要在压缩或解压档案时可选的。 -z:有gzip属性的 -j:有b
2014-03-14 10:09:53
592
转载 Nature:我叫“P值” 这是我的故事
Nature:我叫“P值” 这是我的故事2014-2-28 09:48| 发布者: slytjiaofei| 查看: 140| 评论: 2|来自: 果壳摘要: 衡量统计真实性的“黄金标准”——P值,并非众多科学家想象的那样可靠。 2010年某个瞬间,马特·莫德尔(Matt Motyl)离享受科学荣誉仅有一步之遥。那时,他发现政治极端主义者看到的世界是确实是非黑即白的
2014-03-03 09:54:27
2129
转载 Bisulfite Sequencing
全基因组重亚硫酸盐测序(whole genome bisulfite sequencing)表观遗传学研究已经证实了特定基因区域的DNA甲基化修饰对于染色体构象、基因表达调控机制有着重要影响,而全基因组DNA甲基化研究将是表观基因组学最为关注的内容之一。Bisulfite处理能够将基因组中未发生甲基化的C碱基转换成U,进行PCR扩增后变成T,与原本具有甲基化修饰的C碱基区分开来,再结合高通
2014-02-24 13:17:39
7353
转载 基因敲除小鼠技术
转基因、基因敲入/敲除动物技术已经成为现代生命科学基础研究和药物研发领域不可或缺的重要技术,该技术从上世纪七八十年代诞生以来,至今已有近四十年的历史,经典技术如DNA原核显微注射、胚胎干细胞显微注射技术一直以来经久不衰,在小鼠模型构建方面日趋完善,并且如同剪切酶和抗体等常规分子生物学试剂的制备技术一样,逐渐从基础研究实验室转向商业模式,成为一项高度标准化的新兴产业,催生了数以百计的创新药物和数以千
2014-02-20 15:02:27
6506
转载 转录组测序分析中cufflinks的使用及问题
在转录组高通量测序数据分析过程中,主要就是转录本的构建(拼接)及表达水平的衡量,其次还包括可变剪接之类的转录后修饰等研究分析。因此,做过RNA-seq转录组测序数据分析的童鞋们一定使用过或至少听说过Cufflinks这个软件。Cufflinks是加利福尼亚大学伯克利分校数学和计算机生物实验室,由LiorPachter领导的StevenSalzberg’s团队,和马里兰大学生物信息和计算
2014-02-08 09:00:56
2134
原创 技术篇--shell中只列出目录的方法
在shell中列出目录有四种方法:1. ls -d */2. ls -F | grep "/$" 当使用-F时,所有的输出项都会添加上一个代表文件类型的字符,如@、*、|等。对于目录项,添加的是 / 字符。可以用grep过滤目录项。3. ls -l | grep "^d" ls -l 输出的每一行的第一个字符表示文件类型。目录的文件类型字符是“d”。4.
2014-01-24 17:08:35
1363
原创 生信常用软件
1.序列比对软件: http://en.wikipedia.org/wiki/List_of_sequence_alignment_software2.测序质量评估: http://seq.cn/forum.php?mod=viewthread&tid=1806
2014-01-15 10:29:21
2752
原创 一个新基因的产生
一个新基因的产生,不仅仅是产生一个新的基因序列,其对应的调控机制和调控原件也应该伴随产生,不然这个基因就是个不受调控的基因,对生物体造成不可逆的伤害,导致个体死亡,这个基因也就无法遗传得以保留。
2014-01-14 17:16:15
1123
原创 序列拼接相关知识
一.依赖于参考序列的拼接,在进行对参考序列的比对时,有两类区域reads不能很好的进行比对匹配:1.原参考序列中存在未知的序列区域,主要为scaffolds之间的连接区域和scaffolds内的gaps区域,多由富含重复序列或极端GC含量等原因造成测序不完整;2.两个物种之间序列的固有差异区域,包括SNPs,small Indels,large Indels 和inversion等。在上述
2014-01-06 10:13:01
2032
原创 印记基因
最近在做杂交方面的转录组,无意中看到了印记基因(imprinted gene),觉得有用,收集资料,备用。http://users.rcn.com/jkimball.ma.ultranet/BiologyPages/I/Imprinting.html
2014-01-03 17:14:10
1403
原创 测序界的第一次
第一个被测序的全基因组:X174噬菌体 1977第一个被测序的爬行动物基因组:北美绿色安乐蜥(Anolis carolinensis) 2011第一个被测序的藻类基因组:超小型原始红藻(Cyanidioschyzon merolae) 2004第一个被测序的多细胞生物: 秀丽隐杆线虫
2014-01-03 17:08:49
1587
原创 转录组学研究
使用高通量测序技术对物种的转录组进行研究,具有以下优点:1.灵敏度高,可以对痕量RNA进行检测和定量;2.可以获得转录本全长,不但利于进行更准确的定量分析,而且可以发掘新转录本形式及插入/缺失突变;3.适用于无参考序列物种,通过转录组数据的组装和拼接同样可以进行定量和定性分析;
2014-01-02 13:45:02
1398
原创 高通量测序与杂交优势
杂交优势的遗传学假说1.显性假说(dominance):多数显性基因对个体是有利的,隐性基因则相对有害;杂交子代减少了纯合隐性基因出现的概率,积累了两个亲本有利的显性基因,因此出现杂交优势。2.超显性假说(overdominance):杂交优势源于等位基因在杂合子中的表现型往往超过亲本的纯合子表现型,即杂合子是比两种纯合子都更具有优势的状态。
2014-01-02 12:07:58
1343
转载 RNA测序研究现状与发展
RNA测序研究现状与发展 : RNA测序(RNA-seq)是最近兴起的一种基因表达研究技术,不仅可以对基因表达的情况进行整理、归类(cataloging),也可以对基因表达情况进行比较。国际RNA测序基因组注释评价项目协会(international RGASP consortiu ...
2013-12-31 15:28:49
3106
转载 NCBI:Refseq
NCBI的参考序列计划(RefSeq)将为中心法则中自然存在的分子,从染色体到mRNA到蛋白提供参考序列标准。RefSeq标准为人类基因组的功能注解提供一个基础。它们为突变分析,基因表达研究,和多态发现提供一个稳定的参考点。范围:目前,RefSeq记录为下列分子类型和基因组提供:分子 登录格式 基因组Complete G
2013-12-30 09:31:01
7648
转载 NCBI:UniGene数据库
基于转录组的数据分析,UniGene是一个不可多得的资源,他将mRNA、EST序列以及功能gene进行整合,很容易明白EST、mRNA等转录组数据与gene的关系,同时通过EST所附带的信息,统计了基因的表达谱。UniGene参考了转录组、基因组的信息,通过多次循环聚类,整合尽可能多的数据,NCBI对UniGene按物种进行定期的更新,发布新的版本。UniGene的数据可以通过FTP按物种
2013-12-30 08:36:47
8907
翻译 Unigene build produce(NCBI)(译文)
UniGene是从属于GeneBank的一部分,专门收集非冗余性的基因来源的clusters数据。每一个UniGene Cluster包含代表单一基因的序列和相关的信息,例如基因表达的组织类型和图谱定位信息。除了这些具有具有特征的序列以外,成千上万的EST也被收录在内。因此,相应的,这些收集的资源可以作为基因发现的来源。现在,许多实验室研究人员已经利用UniGene进行大规模的基因表达图谱分析
2013-12-27 16:50:29
1494
转载 Unigene build produce(NCBI)(原文)
Genome-Based UniGene Build ProcedureThe availability of genomic sequence is helpful for identifying sets of transcript sequences that correspond to distinct transcription loci or to annotated gene
2013-12-27 16:33:13
1165
转载 测序中常用的术语
SBS:边合成边测序反应,每次SBS会延伸一个碱基,大约耗时70分钟。Run:单次上机测序反应,可以产生4G-75G测序通量不等。Lane:单泳道,每条泳道可以直接物理区分测序样品,1次run最多可以同时上样8条Lane。Channel:Lane的同义词。Tile:小区,每条Lane中排有2列tile,合计120个小区。每个小区上分布数目繁多的簇结合位点。Cluster:簇,在
2013-12-27 16:04:39
5871
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人