绪论
生物信息学概述
背景
- 人类基因组计划 (HGP)
第三大科学计划,“达尔文以后意义最为重大的生物学发现”,标志人类探索生命奥秘的进程与生命技术发展进入崭新时期。
目标为完成23对染色体中DNA碱基序列测定序组 - 最初目标:构建人类基因组遗传图、物理图,确定人类DNA全部核苷酸序列,定位10W基因并对其他生物图进行类似研究
遗传图
物理图
序列图
基因图 - 终极目标:
阐明人类基因组全部DNA序列
识别基因:建立储存基因信息数据库
开发数据分析工具
研究伦理等社会问题
2013年
对标准人类参考基因组,即2013年发布的参考基因组序列(GRCh38)的“重大升级”。
使人类第一次看到最完整的、无间隙的DNA碱基基因序列
后基因组时代
对大量的基因组数据进行组装、拼接及注释后,对基因的挖掘以及功能验证。
通过对这些功能的基因挖掘及分析,进而对调控、代谢产生分子生物学水平的认识
应用:
- 基因突变检测与应用
- 精准医疗的基础
DNA: 遗传物质(遗传信息的载体)→ 双螺旋结构A, C, G, T四种基本字符的复杂文本
基因(Gene):具有遗传效应的DNA分子片段
研究意义
- 生物学数据分析中获得对生命运行机制,疾病机理的深入理解
1.1. 认识生物本质:了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系
1.2 改变生物学的研究方式 - 为疾病的诊断和治疗提供依据,为设计新药提供依据
生物信息学当前的主要研究任务
平台建设
- 数据收集并建立数据库
- 信息传输系统
- 数据质量评估检测系统
- 信息可视化
- 在线服务
基因组序列分析
- 蛋白编码区与基因结构预测 —— 了解运作机理
- 基因调控序列分析预测
- 非编码区序列分析
- 比较基因组 ——构建遗传图谱,不同物种基因组水平差异与共同点
蛋白质结构预测
——. 结构与功能密切联系
—— 有助于阐明疾病机理,进行药物设计
蛋白质功能预测
——疾病治愈、药物设计
基因表达谱数据分析
——从基因转录水平反应细胞状态
——筛选疾病相关基因
——解释疾病分子机制
疾病基因的预测
——了解疾病机理
——研究疾病基因诊断、防止手段
——发现疾病基因
生物信息学与药物设计
生物医学图像的处理
——图形学+图像处理
互联网+医疗的数据分析