- 博客(28)
- 收藏
- 关注
原创 selenium-蛋白质组学数据爬取
背景:Box driver中的数据无法自动下载,使用对应的下载链接也需要登录后才能在浏览器中使用,于是使用selenium对其进行自动下载。
2023-12-13 17:44:34
502
原创 NBIS单细胞教程:细胞类型(六)
此文章是通过学习瑞典国家生物信息学基础设施(NBIS) 所开放的单细胞分析教程加上网上所查找的资料,自身的理解所形成的,可能会有不足之处。该部分是对不同集群的细胞类型进行识别。参考来源:https://github.com/NBISweden/workshop-scRNAseq/blob/master/labs/seurat/seurat_06_celltype.Rmd感兴趣的话可以阅读原文。
2022-11-30 15:21:29
1223
原创 NBIS单细胞教程:差异基因(五)
此文章是通过学习瑞典国家生物信息学基础设施(NBIS) 所开放的单细胞分析教程加上网上所查找的资料,自身的理解所形成的,可能会有不足之处。该部分是对不同集群之间的差异基因进行分析。参考来源:https://github.com/NBISweden/workshop-scRNAseq/blob/master/labs/seurat/seurat_05_dge.Rmd感兴趣的话可以阅读原文。
2022-11-30 15:15:40
10962
1
原创 ggplot2-图例
legend就是ggplot绘制过程中,对分类变量产生的一个解释性图像,通常位于ggplot图形的右侧。一般而言,我们可以使用guides,theme,scale_*scale_*guidestheme以下,我们就介绍如何对图例进行修改。
2022-11-13 17:08:02
2382
原创 多层饼图-ggplot2
这次需要绘制的如下所示的多层饼状图:总的来说就是对你的数据的分类要求更严格一些,分为大类及大类下面的小类,其实这样的数据可以靠Excel画出来,不过我还是想用R来实现。最开始的时候,按照[【R语言】多层饼图][https://www.jianshu.com/p/7410c023df7b]这个教程的方法去画图,可是在绘制的时候发现了一些问题。
2022-11-11 23:12:05
2082
1
原创 分布数据图-R/python
python绘图:https://mp.weixin.qq.com/s/DY_K1CisYElFL7Tt0Si6hw。R语言绘图:https://mp.weixin.qq.com/s/zLIsgnfKgSFjL6jrboIgkg。
2022-11-04 19:58:51
731
原创 排序数据图-R/python
R绘图:https://mp.weixin.qq.com/s?python绘图:https://mp.weixin.qq.com/s/DY_K1CisYElFL7Tt0Si6hw。
2022-11-02 21:19:24
290
原创 prinseq
PRINSEQ全称是PReprocessing and INformation of SEQuences,拥有在线分析管道,也有命令行版本。PRINSEQ是一个可以用来过滤,转换(reformat),或者剪切基因组/宏基因组数据的一个工具,他可以统计基因组序列质量信息,以图表的形似输出(感觉上和fastqc类似,但实际不一样)。网址:https://prinseq.sourceforge.net/manual.html。
2022-10-28 20:43:15
716
原创 Cutadapt
在对下机数据进行处理的时候,原始的数据一般都带有接头,如果不除去接头序列,会对接下来的基因组装和比对产生较大的误差,所以这个时候需要对原始数据进行接头处理并过滤掉质量较差的序列,其中Cutadapt是一个比较经典的能够对双端进行接头切除的软件。
2022-10-20 21:48:49
4418
原创 NBIS单细胞教程:降维聚类(四)
此文章是通过学习瑞典国家生物信息学基础设施(NBIS) 所开放的单细胞分析教程加上网上所查找的资料,自身的理解所形成的,可能会有不足之处。该部分是使用整合后的PCA来进行聚类。参考来源:https://nbisweden.github.io/workshop-scRNAseq/labs/compiled/seurat/seurat_01_qc.html感兴趣的话可以阅读原文。......
2022-08-26 09:04:31
2052
3
原创 NBIS单细胞教程:批次效应矫正(三)
此文章是通过学习瑞典国家生物信息学基础设施(NBIS) 所开放的单细胞分析教程加上网上所查找的资料,自身的理解所形成的,可能会有不足之处。该部分是整合不同批次的单细胞数据并矫正批次效应。参考来源:https://nbisweden.github.io/workshop-scRNAseq/labs/compiled/seurat/seurat_01_qc.html感兴趣的话可以阅读原文。
2022-08-25 08:25:11
1759
原创 NBIS单细胞教程:降维(二)
参考来源:https://nbisweden.github.io/workshop-scRNAseq/labs/compiled/seurat/seurat_01_qc.html感兴趣的话可以阅读原文。
2022-08-24 08:52:23
1200
原创 NBIS单细胞教程:质控(一)
此文章是通过学习瑞典国家生物信息学基础设施(NBIS) 所开放的单细胞分析教程加上网上所查找的资料,自身的理解所形成的,可能会有不足之处。该部分是对下机处理完成后的数据进行Seurat分析的质控。参考来源:https://nbisweden.github.io/workshop-scRNAseq/labs/compiled/seurat/seurat_01_qc.html感兴趣的话可以阅读原文。
2022-08-21 19:30:19
7525
原创 生物基因结构
最近需要对启动子区域进行预测,所以首先对启动子的结构特征进行了解,而说到启动子,那就一定要了解基因结构,所以,在网上查找了部分资料进行整理与学习。首先,根据RNA合成的不同时期,从DNA到成熟mRNA,分为三个阶段了解基因结构的变化。......
2022-08-18 21:09:16
13416
原创 GFFcompare详解
当与参考注释(也作为 GFF 提供)进行比较时,程序 gffcompare 可用于比较、合并、注释和估计一个或多个 GFF 文件的准确性。Github:https://github.com/gpertea/gffcompareReference: http://ccb.jhu.edu/software/stringtie/gffcompare.shtml下载与安装源码安装wget http://ccb.jhu.edu/software/stringtie/dl/gffcompare-0.1
2022-05-28 15:50:48
7169
1
原创 Stringtie详解
StringTie 是一种快速高效的将 RNA-Seq 比对到潜在转录本的组装器。它使用新的网络流算法以及可选的从头组装步骤来组装和定量代表每个基因位点的多个剪接变体的全长转录本。它的输入不仅可以包括其他转录组装器也可以使用的短读取比对,还可以包括从这些读取组装的较长序列的比对。为了识别实验之间的差异表达基因,StringTie 的输出可以通过专门的软件如 Ballgown、Cuffdiff 或其他程序(DESeq2、edgeR 等)进行处理。下载与安装源码安装wget http://ccb.jh
2022-05-28 10:52:41
5013
原创 NR数据库的物种注释
NR数据库的物种注释1.创建NR子库为什么要创建nr或nt数据库的子库,因为这两个库数据量巨大,若只专注某个领域而非全部,则在对自身领域进行注释时就会耗费大量时间,为了节省时间,就需要在原来nr/nt数据库的基础上构建相对的子库。构建方法如下:方法一:从NCBI官网下载相应物种的Accession ID在2017年之后的nr/nt数据库变成不再支持gi号搜索的。所以我们不可以根据gi号来分离并构建对应的子库,那么我们就需要查看新版本的nr/nt库的序列的id特征,发现他们变成了accessio
2021-10-09 11:28:47
13760
原创 NCBI数据库以及常用编号
NCBI数据库在微生物测序分析中,常常需要对未知的核酸或蛋白序列进行物种,功能或类别注释。注释方法种类较多,其中最常用的是与一些标准数据库进行相似性搜索,也就是序列比对。因此,数据库的优劣对注释结果至关重要。NR/NT数据库NR(Non-Redundant Protein Sequence Database)非冗余蛋白库,所有GenBank+EMBL+DDBJ+PDB中的非冗余蛋白序列,对于所有已知的或可能的编码序列,NR记录中都给出了相应的氨基酸序列(通过已知或可能的读码框推断而来)以及专门蛋白数据
2021-10-06 20:43:13
7758
原创 Vim文本编辑器命令和配置
Vim文本编辑器Vim编辑器简介vi编辑器是Unix系统最初的编辑器。它使用控制台图形模式来模拟文本编辑窗口,允许查看文件中的行、在文件中移动、插入、编辑和替换文本。尽管它可能是世界上最复杂的编辑器(至少讨厌它的人是这么认为的),但其拥有的大量特性使其成为Unix系统管理员多年来的支柱性工具。在GNU项目将vi编辑器移植到开源世界时,他们决定对其作一些改进。由于它不再是以前Unix中的那个原始的vi编辑器了,开发人员也就将他重命名为vi improved, 或vim。vim是vi的升级版,最常见的区
2021-07-07 21:01:05
1384
1
原创 ANI-平均核苷酸一致性
ANI-平均核苷酸一致性ANIDDH(DNA-DNA hybridization)DNA分子杂交-曾经作为基因组水平上的原核物种界定的黄金标准已经被使用了将近50年。它作为唯一的提供数字化和相对稳定物种界定的分类学方法,它对现在的分类方法有着重要的影响地位。但是,现在的基因组学时代,DDH显得有点过时了。两个基因组间ANI(average nucleotide identity)由于最能反映DDH,是一种不错的分类的方法。物种的概念大概由2,400年前的 Aristotle(亚里士多德)提出来的
2021-07-01 07:43:48
15816
1
原创 Python生成器与迭代器
Python生成器与迭代器1. 生成式列表生成式列表生成式就是一个用来生成列表的特定语法形式的表达式。是Python提供的一种生成列表的简洁形式, 可快速生成一个新的list。普通的语法格式 [exp for iter_var in iterable]带过滤功能语法格式: [exp for iter_var in iterable if_exp]循环嵌套语法格式: [exp for iter_var_A in iterable_A for iter_var_B in iter
2021-06-29 09:49:05
440
原创 Linux文件管理指令-参数详解
cat指令描述:cat(英文全拼:concatenate)命令用于连接文件并打印到标准输出设备上。语法cat [-AbeEnstTuv] [--help] [--version] fileName参数:-n 或 --number:由 1 开始对所有输出的行数编号。-b 或 --number-nonblank:和 -n 相似,只不过对于空白行不编号。-s 或 --squeeze-blank:当遇到有连续两行以上的空白行,就代换为一行的空白行。-v 或 --show-nonprinting:
2021-06-24 20:05:22
814
转载 Linux命令总结
Linux命令总结基本命令uname -m 显示机器的处理器架构uname -r 显示正在使用的内核版本dmidecode -q 显示硬件系统部件(SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性hdparm -tT /dev/sda 在磁盘上执行测试性读取操作系统信息arch 显示机器的处理器架构uname -m 显示机器的处理器架构uname -r 显示正在使用的内核版本dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI
2021-06-24 19:44:51
80
原创 Linux-系统管理常用命令
收集了常用的Linux系统管理命令,以待日后查询或使用。adduser命令Linux adduser命令用于新增使用者帐号或更新预设的使用者资料。adduser 与 useradd 指令为同一指令(经由符号连结 symbolic link)。使用权限:系统管理员。adduser是增加使用者。相对的,也有删除使用者的指令,userdel。语法:userdel [login ID]语法adduser [-c comment] [-d home_dir] [-e expire_date] [-f.
2021-06-24 09:23:38
2596
原创 Linux的安装指令:yum/apt-get的用法与区别
yum与apt-get的用法与区别一般来说著名的linux系统基本上分两大类:1.RedHat系列:Redhat、Centos、Fedora等2.Debian系列:Debian、Ubuntu等RedHat 系列常见的安装包格式rpm包,安装rpm包的命令是rpm -参数包管理工具 yum支持tar包Debian系列常见的安装包格式 deb包,安装deb包的命令是dpkg -参数包管理工具apt-get支持tar包tar 只是一种压缩文件格式,所以,它只是把文件压缩打包而已。
2021-06-22 21:01:47
2405
原创 shiny-server部署
shiny部署一、shiny-server的安装1.安装Shiny1.1 安装Rsudo apt install r-base1.2 安装Rstudio-server-8787#安装方式一sudo apt-get install gdebi-coresudo apt-get install libapparmor1wget https://download2.rstudio.org/rstudio-server-1.0.143-amd64.debsudo gdebi rstudio-s
2021-06-19 07:36:37
2131
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人