
R语言在计算生物学中的应用
文章平均质量分 85
从0开始了解R语言,并了解其在计算生物学(computational biology)和生物信息学(bioinformatics)中的应用。
EricFrenzy
坚定的python党,有python java c++ c html css javascript scratch R 小程序的开发经验,努力奋斗ing。
展开
-
(七)R语言生物序列比对——Smith-Waterman局部比对算法
目录实现原理与代码全部代码结束语实现原理与代码像全局序列匹配一样,局部序列比对的目的也是找到两个序列之间的相似度。 Smith-Waterman这一局部比对算法的原理和Needleman-Wunsch全局比对算法一样,也是运用了动态规划(DP)的思想。具体关于Needleman-Wunsch全局比对算法可参考我的这篇博客。Smith-Waterman算法经常两序列长度相差较大时使用,或需要匹配两序列中相似的片段。在的工作原理和Needleman-Wunsch也非常相似,只是在创建初始矩阵时第一行和第一列原创 2021-09-28 12:20:42 · 4084 阅读 · 1 评论 -
(六)R语言生物序列比对——Needleman-Wunsch全局比对算法
目录实现原理与代码全部代码结束语实现原理与代码生物序列全局比对的主要目的是发现两个序列之间的相似度,从而估测二者的进化联系或相似功能。Needleman-Wunsch全局比对算法用到了动态规划(Dynamic Programming)的原理。它的主要工作流程见下图:在介绍具体算法前,我们先要定义一个得分矩阵。得分矩阵的目的是告诉程序某两个碱基配对的得分:match <- 2mismatch <- -1gap <- -2scoreMat <- matrix(misMa原创 2021-08-15 11:00:30 · 4800 阅读 · 0 评论 -
(五)R语言入门生物信息学——ORF和序列分析
注:本博客旨在分享个人学习心得,有不规范之处请多多包涵!目录概念介绍找ORF的代码实现结束语概念介绍在人体内,为了表达DNA上的基因,这个基因包含的DNA在被转录为pre-mRNA后经过进一步处理成为成熟的mRNA,mRNA紧接着会被核糖体用来合成蛋白质,从而控制生物体的反应。在mRNA上,每三个碱基组成一个密码子,对应一种氨基酸。下图为密码子与氨基酸的对照表:要合成一个正常的蛋白质,mRNA序列上的两端需要分别有一个起始密码子(图上标为start)和一个终止密码子(图上标为stop)。但在DNA原创 2021-08-06 16:47:28 · 5496 阅读 · 0 评论 -
(四)R语言的数据可视化——矩阵图、柱状图、饼图、散点图与线性回归、带状图
注:本博客旨在分享个人学习心得,有不规范之处请多多包涵!目录Histogram 矩形图Bar plot 柱状图Pie chart 饼图Dot plot 散点图Box-and-whisker plot 箱形图Strip chart 带状图结束语Histogram 矩形图在统计学中,矩形图经常被用作展示某连续变量(如长度、重量等测量数值)的分布。在R语言中构造矩形图用hist()函数,具体请见下例:#hist()函数第一个参数为数据,这里用的是sampleData列表中列标题为length的数据#ma原创 2021-08-01 21:01:19 · 5998 阅读 · 0 评论 -
(三)R语言的生物信息学入门——Function, data.frame, 简单DNA读取与分析
注:本博客旨在分享个人学习心得,有不规范之处请多多包涵!目录Function 函数data.frame 数据框DNA序列读取与分析实例结束语Function 函数像其它的编程语言一样,R语言也有内置函数(如前面用到的c())和自定义函数。函数一般由三个重要的部分组成:输入参数,函数主体,返回参数。R语言的函数也是允许无输入参数或返回参数的的。以下的例子为在R语言中构造与调用函数:#用R语言内置的function()函数来声明函数,并在括号内声明输入参数。可以用=为参数设置默认值#getDouble原创 2021-07-29 10:54:15 · 3576 阅读 · 0 评论 -
(二)R语言数据结构——Vector, Matrix, List
注:本博客旨在分享个人学习心得,有不规范之处请多多包涵!目录Vector 向量Matrix 矩阵List 列表结束语Vector 向量简单来说,R语言中的vector是一个包含许多元素的一维数据结构,类似Python里的列表。下面的命令可以构造一个简单的R语言向量:#c()函数意思为connect,它把括号里的内容整合成一个vector或listmyVec1 <- c(1, 2, 3, 4, 5)myVec2 <- 1:5myVec3 <- seq(1, 5, 1) #从1开原创 2021-07-28 17:35:57 · 5413 阅读 · 0 评论 -
(一)R语言入门指南——数据分析的第一步
注:本博客旨在分享个人学习心得,有不规范之处请多多包涵!目录R语言数值与逻辑运算符变量类型与赋值逻辑判定与循环结束语R语言简单来说,R语言是一个免费开源、数据分析和可视化功能强大的编程语言。R语言的下载与安装请至R语言官网。下载完R语言后,推荐下载安装并使用RStudio这一开发环境。下载完成后,打开RStudio,就会看到如下图的界面:左边这部分是Console,可以直接输命令。如果想创建文件写代码的话,点开最左上角的下拉菜单即可选择。一般使用的是R Script文件。接下来博主的操作可全部原创 2021-07-27 20:24:51 · 1775 阅读 · 0 评论