自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 生信小白的工作笔记

WDLWDL (一个workflow description language)+ Cromwell(an execution engine that can run WDL scripts)是目前可以更好使用GATK的一套工具。WDL是一种流程管理语言,内置的支持并行,适合编写pipeline运行wdl脚本需要两步:第一步编辑参数列表对应的json文件,第二步直接运行Cromwell.jarWDL脚本的5个组成workflow;task;call;command;output1个WDL脚

2020-10-16 14:56:14 4736

原创 《泛基因组学》学习笔记

单一“参考基因组”分析模式的局限参考基因组这里的==“典型”泛指一个或者多个特定个体==(这些个体是研究者所能获得样本,它们未必是最最具代表性的,这个要注意)。我们熟知的 “人类基因组计划(HGP)” 测序得到的基因组序列其实只是人类这个物种少量个体的基因组序列,我们将它称之为“人类基因组参考序列”,它由若干个高加索人的基因组序列合并而成。基因组学的研究都需要围绕 “参考基因组” 来开展,因此它的作用和意义非凡。以人类基因组学研究为例,通常情况下我们要将新测序的人类基因组数据和参考基因组进行比对,才能

2020-09-30 09:22:12 5902 2

原创 Docker入门学习笔记

DockerDocker是一个虚拟环境容器,可以将你的开发环境、代码、配置文件等一并打包到这个容器中,并发布和应用到任意平台中。Docker的3个概念镜像 image类似于虚拟机中的镜像,是一个包含有文件系统的面向Docker引擎的只读模板。任何应用程序运行都需要环境,而镜像就是用来提供这种运行环境的。例如一个Ubuntu镜像就是一个包含Ubuntu操作系统环境的模板,同理在该镜像上装上Apache软件,就可以称为Apache镜像。容器 container类似于一个轻量级的沙盒,可以将其看

2020-09-24 10:26:57 337

原创 小白的基因测序学习之路——#001有关基因的那些事

什么是基因?首先,我们应该了解一下染色体,DNA,RNA,基因之间的关系。基因的定义基因是控制生物性状的基本遗传单位。基因(遗传因子)是产生一条多肽链或功能RNA所需的全部核苷酸序列。也就是说,基因只是DNA链中的一个个片段。每一片段会控制不同的性状。按照基因结构,可分为编码区和非编码区。编码区真核生物的编码区是不连续的,分为外显子和内含子,在转录过程中会修剪内含子,并拼合外显子来形成转录产物。在原核生物中,基因是连续的,也就是说无外显子和内含子之分。外显子 Exon外显子

2020-06-23 14:35:47 4468

原创 《全基因组测序WGS数据分析——4.构建WGS主流程》学习笔记

流程的具体形式其实是次要的,WGS本质上只是一个技术手段,重要的是,要明白自己所要解决的问题是什么,所希望获取的结果是什么,然后再选择合适的技术。这是WGS数据分析的流程图。流程的目的是准确检测出每个样本(这里特指人)基因组中的变异集合,也就是人与人之间存在差异的那些DNA序列。整个分析过程按照它们实际要完成的功能,将其分成了三个大的模块:原始数据质控数据预处理变异检测0.准备阶段在开始之前,我们需要做一些准备工作,主要是部署好相关的软件和工具。我们在这个WGS数据分析过程中用到的

2020-06-16 18:28:29 3810 1

原创 《全基因组测序WGS数据分析——3.数据质控》学习笔记

整个完整的流程分为以下6部分:原始测序数据的质控read比对,排序和去除重复序列Indel区域重(“重新”的“重”)比对碱基质量值重校正变异检测变异结果质控和过滤数据质控的意义现在的NGS测序,以illumina为首基本都是运用边合成边测序的技术。碱基的合成依靠的是化学反应,这使得碱基链可以不断地从5’端一直往3’端合成并延伸下去。但在这个合成的过程中随着合成链的增长,DNA聚合酶的效率会不断下降,特异性也开始变差,这就会带来一个问题——越到后面碱基合成的错误率就会越高【注】,这也是为

2020-06-16 10:42:38 9434

原创 《全基因组测序WGS数据分析——2.FASTA和FASTQ》学习笔记

在WGS数据的分析过程中,我们会接触到许多生物信息学/基因组学领域所特有的数据文件和它们特殊的格式,在这一节中将要介绍的FASTA和FASTQ便是其中之一二。这是我们存储核苷酸序列信息(就是DNA序列)或者蛋白质序列信息最常使用的两种 文本文件,虽然看起来名字有些古怪,但它们完全是纯文本文件(如同.txt)!名字的发音分别是fast-A和fast-Q。这一篇文章内容虽然比较简单,但还是比较长,我在这里详细介绍了这两类文件的格式特点和一些在分析的时候需要考虑的地方。FASTAFASTA这个文件的来源为一

2020-06-16 09:20:17 3569

原创 《全基因组测序WGS数据分析——1.DNA测序技术》学习笔记

WGS(Whole Genome Sequencing)指将物种细胞里面完整的基因组序列全部DNA,检测并排列,此技术几乎能够鉴定出基因组上任何类型的突变。对于人类来说,全基因组测序的价值是极大的,它的信息包含了所有基因和生命特征之间的内在关联性,当然也意味着更大的数据解读和更高的技术挑战。测序,简单来说就是将DNA化学信号转变为计算机可处理的数字信号。第一代测序技术——sanger法Sanger法是基于DNA合成反应的测序技术,又称为SBS法、末端终止法。1975年由Sanger

2020-06-16 00:33:42 5206

原创 《python之常用设计模式》学习笔记

软件开发设计流程需求分析分析和设计(将系统模块进行划分 设计每个模块的类和方法)编写实现封装将数据 属性 函数方法 封装到一个类中私有 封装后 限制外部调用继承通过继承来复用封装好的类的代码多态python本身是多态语言通过接口 程序调用运行 更有效率 不易出错 更标准化python中实现接口的方法1先写好接口 定义好类然后再分别写相关的类继承 并完善其方法2 通常用此种方法定义接口定义抽象类 和 抽象方法...

2020-05-17 23:42:00 233

原创 《Django初级入门与实践》学习笔记

Django简介Django是基于python的高级web开发框架可进行高效快速开发高度集成 免费开源知识补充环境搭建创建项目如何修改端口号python manage.py runserver 9999(端口号)创建应用创建第一个页面配置URL/index 为blog下配置url的总路径/index/ind...

2020-04-27 20:37:25 230

原创 《人类染色体与染色体病》学习笔记

染色质与染色体染色质为细丝状当细胞分裂时 染色质复制反复盘绕高度压缩 凝集形成兴泰特定的条状染色体 以保证DNA能准确分配到两个子细胞中染色质和染色体的化学组成DNA和组蛋白占染色质化学总量98%以上染色质的种类染色质由于其折叠及压缩程度的不同 在形态、染色性能和功能上呈现出差异可将染色质分为两大类 常染色质、异染色质常染色质折叠压缩程度较低 处于伸展状态碱性...

2020-04-24 23:43:26 17807

原创 《线粒体疾病的遗传》学习笔记

线粒体概述线粒体是真核细胞的能量代谢中心细胞呼吸作用中的氧化还原反应是在线粒体中进行 并在此过程中产生大量的能量 供给整个机体利用线粒体是细胞质中独立的细胞器 也是动物细胞核外唯一的含有==DNA(mtDNA)==的细胞器线粒体内含有DNA分子 被称为人类第25号染色体 是细胞核以外含有遗传信息和表达系统的细胞器 其遗传特点表现为非孟德尔遗传方式又称核外遗传mtDNA具有半自主性人m...

2020-04-24 16:34:15 4196

原创 《群体遗传学》学习笔记

群体遗传学 即以群体为对象来研究群体的遗传和变异的学科群体中的基因和基因型频率概念群体指同一物种生活在某一地区内的 能相互杂交的个体群也称为孟德尔式群体遗传学将一个群体中所有个体含有的全部遗传信息(或基因)称为 基因库医学群体遗传主要探讨遗传病的发病频率 遗传方式及致病基因频率和变化的规律基因频率指某一基因在群体中出现的频率也是某一种等位基因的占该位点上全部等位...

2020-04-24 00:30:06 2553

原创 《多基因病的遗传》学习笔记

人类的一些性状或遗传病不是决定于一对主基因 而是由多对基因协同决定这些基因对表型影响小 为微效基因多对微效基因有累加效用 共同作用形成明显表型 为加性效应 这些基因为加性基因多基因遗传 除受微效基因作用外 还收环境因素的影响 因此也成为多因子遗传质量性状与数量性状质量性状质量性状的分布是不连续的 存在着全或无的关系 没有中间的类型数量性状不同个体之间存在着程度或数量上的差...

2020-04-22 18:22:18 4376

原创 《单基因疾病的遗传》学习笔记

单基因遗传病的基本概念与研究方法定义由一对等位基因控制而发生的遗传性疾病这对等位基因成为主基因单基因遗传病的遗传 可分为核基因遗传病 和 线粒体基因遗传病核基因遗传病 上下代之间传递遵循孟德尔定律基本概念等位基因人群中某一基因发生结构改变而与原DNA结构组成有所不同这一新的基因结构为原基因的等位基因用大写字母表示显性基因用小写字母表示隐性基因基因型一个个体的遗传...

2020-04-21 23:39:02 3838 1

原创 《基因突变》学习笔记

基因突变的特性与诱发因素突变突变 指遗传物质发生可遗传变异突变类别染色体畸变:染色体数目和结构的改变基因突变:DNA碱基对组成与序列的变化基因突变生殖细胞突变 可通过有性生殖传递后代个体体细胞突变 不会传递后代个体 可通过突变细胞分裂增殖形成突变细胞克隆基因突变的特征多向性 :任何基因座上的基因都有可能独立的发生多次不同的突变 而形成新的等位基因如 在不同...

2020-04-21 17:20:12 3810

原创 《Shell编程之正则表达式》学习笔记

正则表达式因为是包含匹配 所以会取到 大于三次的字符串行正则式表达案例字符截取命令grep - v 为取反操作cut为列提取命令df 命令为显示系统中分区情况cut 默认 分隔符为制表符printf输出文件...

2020-04-20 21:58:10 196

原创 《人类基因和基因组》学习笔记

人类基因和基因组基因及其结构基因是细胞内遗传物质的结构和功能单位以脱氧核糖核酸(DNA)的化学形式存在于染色体上DNA分子组成基本单位为 脱糖核苷酸脱氧核苷酸的组成为 一分子脱氧核糖 一分子磷酸 一分子含氮碱基碱基有四种 == A腺嘌呤T胸腺嘧啶C胞嘧啶G鸟嘌呤==4种脱氧核苷酸按一定顺序首尾相接构成脱氧多核苷酸单链每条脱氧核苷酸单链都有3’端 (-OH)和 5‘端 (磷酸...

2020-04-20 18:16:58 4167

原创 《遗传学与医学》学习笔记

医学遗传学导论医学遗传学医学+遗传学 交叉学科 研究遗传病医学遗传学分支学科细胞遗传学细胞水平 研究染色体病变生化遗传学生物化学角度 研究蛋白质/酶以及核酸的变化了解分子病和遗传代谢病分子遗传学从现代新技术 了解基因结构突变 研究遗传病的分子改变Q:先天性疾病并不都是遗传病群体遗传学研究人群中的遗传结构及变化规律药物遗传学研究药物代谢、...

2020-04-20 15:41:08 510

原创 《Linux达人养成计划2》学习笔记

vim编辑器vi概述vi操作模式i键 切换到编辑输入模式 可进行输入输入完成后 按esc 输入:wq 保存退出dd为命令 可以删除光标所在的那行vi的命令格式vim + abc 为打开文件后 光标定在最后一行 vim +3 abc 为打开文件后 光标定在第三行 vim +/imooc abc 为打开文件后 光标定在imooc第一次出现的那行 按n...

2020-04-08 01:46:40 219

原创 《Linux达人养成计划1之shell篇》学习笔记

shell概述shell有不同版本Bash为Linux标准shell csh tcsh用于unix中echo $shell 可查看shell版本Linux支持的shellvi /etc/shells 可查看支持的shell脚本执行方式echo输出命令将输入的内容打印出来 若有空格 需加双引号第一个脚本 wq 保存退出 q ...

2020-04-07 19:54:50 193

原创 《Linux达人养成计划1》学习笔记

目录命令基本格式及文件处理命令命令基本格式1.命令提示符2.命令格式 命令基本格式及文件处理命令 命令基本格式 1.命令提示符Linux当中管理员账号为 root2.命令格式3.查询目录中内容 lsll :显示目录中详细信息文件权限Linux文件类型有7种:- 文件 / d 目录 / l 软链接文件/ b 块...

2020-04-05 00:28:16 612

原创 《python全栈开发》学习笔记

代码规范PEP8 第8篇PEP-8 网址:https://www.python.org/dev/peps/pep-0008/注释单行 #多行 双引号"…" or三引号 ‘’’…’’’变量变量名字母 数字 下划线组成 下划线不可开头 大小写敏感命名法:大驼峰 小驼峰 posix大驼峰命名给类用age = 21var1 = var2 = var3 = var_va...

2019-10-18 15:20:53 3350

原创 《啊哈算法》学习笔记——第二章(python)

CH2 栈 队列 链表解密QQ号——队列题目:第1个数删除,第2个数放在这串数字末尾,第3个数删除并将第4个数字放在数串末尾,第5个数字删除…直到最后一个数,将最后一个数删除。按照刚刚删除的顺序,即解密后的QQ号。...

2019-09-26 10:45:00 385

原创 《啊哈算法》学习笔记——第一章(python)

CH1 排序桶排序这个算法就好比有 11 个桶,编号从 0~10。每出现一个数,就在对应编号的桶中放一个小旗子,最后只要数数每个桶中有几个小旗子就 OK 了。eg. 2 号桶中有 1 个小旗子,表示2 出现了一次此处的每一个桶的作用其实就是“标记”每个数出现的次数.桶排序的时间复杂度为O(M+N)O(M+N)O(M+N)。def bucket_sort(L): buck...

2019-09-25 18:50:25 494

原创 《计算机概论》学习笔记

Ch0计算机概论1 计算机1.1 计算机硬件五大单元1.2 CPU的种类1.3 接口设备1.4 运作流程1.5 计算机分类1.6 计算机中常用的计算单位2.个人计算机架构与接口设备2.1 CPU2.2 内存2.3 显卡2.4 硬盘与存储设备2.5 PCI适配卡2.6 主板2.7 电源2.8 选购须知3.数据表达方式4.软件程序运行功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接...

2019-09-23 22:17:06 532

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除