北京大学生物信息学
Leesuha
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
北京大学生物信息学-第五周-新一代测序(NGS) 回帖 BWT算法
新一代测序Read: A short DNA fragment which is read out by sequencer.读:由测序仪读出的短DNA片段。DNA序列+质量信息->FASTAQ序列回帖和变异鉴定Reads Mapping:将测序得到的DNA片段也就是Reads定位在基因组上,往往作为深度测序的第一步,其好坏快慢都会对后续操作产生影响。本质上还是双序列比对问题,与经典的双序列比对里有很大的不同。长度数据量数据质量:reads质量参差不齐地位不同:read嵌入其原创 2020-05-27 19:29:53 · 1643 阅读 · 0 评论 -
贝叶斯分类器讲解+实例
贝叶斯定理贝叶斯定理是18世纪英国数学家托马斯·贝叶斯(Thomas Bayes)提出得重要概率论理论。所谓的贝叶斯定理源于他生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有 N 个白球,M 个黑球,你伸手进去摸一把,摸出黑球的概率是多大”。而一个自然而然的问题是反过来:“如果我们事...原创 2019-12-30 14:48:57 · 6232 阅读 · 0 评论 -
北京大学生物信息学-第四周-马尔可夫 HMM及其应用
从状态到马尔可夫链A Markov chain describes a discrete stochastic process at successive times. The transitions from one state to any of all states, including itself, are governed by a probability distribution.马尔可夫链用来描述一组离散状态之间在不同时刻的转移关系。这里的转移关系不需要是唯一确定的,只需要可以由一个概原创 2020-05-20 21:07:42 · 3814 阅读 · 0 评论 -
北京大学生物信息学-第三周-序列数据库 BLAST
序列数据库Genbank是美国国家生物技术信息中心(National Center for Biotechnology Information ,NCBI)建立的DNA序列数据库,从公共资源中获取序列数据SRA(Sequence ReadArchive)数据库是用于存储二代测序的原始数据,包括 454,Illumina,SOLiD,IonTorrent,Helicos 和 CompleteGenomics。除了原始序列数据外,SRA现在也存在raw reads在参考基因的比对信息。BLAST算法初原创 2020-05-18 11:05:46 · 1955 阅读 · 0 评论 -
北京大学生物信息学-第二周-序列比对
序列比对中的基本概念B iology– What is the biological question or problem?D ata– What is the input data?– What other supportive data can be used?M odel– How is the problem formulated computationally?– Or, what’s the data model?A lgorithm– What is the compu原创 2020-05-18 08:50:45 · 1338 阅读 · 0 评论 -
北京大学生物信息学笔记-第一周-生物信息学概述
什么生物信息学?[1] 基因组:生命手册[2] 人类基因组有31亿碱基对[3] 碱基编码基因占~2.9%[4] ~97%的基因以前被称为是"垃圾“[5] 他们包含编码指令的调节元素——什么时候,在哪里,制造多少蛋白质Bioinformatics: an interdisciplinary field that develops and applies computer and computational technologies to study biomedical questions生物信原创 2020-05-17 17:02:36 · 810 阅读 · 0 评论
分享