自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 高通量测序的数据处理与分析指北(二)--宏基因组

进行基于read的物种注释。这种基于read的物种注释方法不依赖于contigs的组装质量,直接通过read和参考基因组比对得到丰度,从原理上讲会比基于bin模式的物种注释快上许多,但是这种基于read的比对模式高度依赖参考基因组的准确性,完整性。适用于人类相关微生物,小鼠相关微生物或者其他研究较为深入的微生物环境。而比较复杂的环境微生物可能用这种方式注释出来的物种会不太准确。基于read的宏基因组物种注释的软件有很多,如。若无法使用命令自动下载,则手动下载。列,这些列是表示次选的物种。

2023-05-28 20:38:12 578

原创 高通量测序的数据处理与分析指北(二)--宏基因组3

博客原文在上一篇文章中,详细的介绍了宏基因组如何下载以及如何使用fastp进行质控,本篇文章主要聚焦于如何对宿主污染进行去除。如何判断存在宿主污染的方法在上一篇文章中有提到,即GC含量严重偏离正态分布时我们就认为原始数据存在宿主污染,这里介绍的去除宿主污染的工具是bowtie2,同样的也有很多其他软件可以做到去污染,如bwa,kneaddata等软件。事实上,去除宿主污染的基本原理就是通过将原始的fastq序列跟人类的参考基因组进行比对,去除比对上的read或者高度匹配的read实现去除宿主污染。显然,这种

2023-05-13 19:10:19 1509

原创 高通量测序的数据处理与分析指北(二)--宏基因组2

然后是每个序列的GC含量,横轴表示GC含量的平均值,纵轴表示read数量,蓝色线是标准线,是原始数据没有被污染的理想分布情况,即符合正态分布。这个模块中横轴代表的是碱基的位置,纵轴代表的是tile的index编号,tile表示的是高通量测序仪上的一小块矩形区域,冷色代表在平均质量附近,暖色代表比平均质量低,正常来讲需要去除掉质量比较的低的部分tile,但是fastp中没有针对于tile编号进行去除的参数,其他质控软件中我也没有找到,所以这一部分质控如何质控目前不清楚,我认为如果上一步,通常N含量不会太高。

2023-04-21 21:44:57 876

原创 高通量测序的数据处理与分析指北(二)--宏基因组篇

之前的一篇文章已经从生物实验的角度讲述了高通量测序的原理,这篇文章旨在介绍宏基因组二代测序数据的处理方式及其原理。在正文开始之前,我们先来认识一下什么是宏基因组。以我的理解,宏基因组就是某环境中所有生物的基因组的合集,这个环境可以是下水道,河流等自然环境,也可以是人体内肠道,口腔等体环境。而宏基因组中的生物往往指的是微生物,如真菌,细菌,病毒,古细菌。我们这里主要以肠道微生物为例,也就是人体内肠道的宏基因组。

2023-04-16 14:04:16 1069

原创 为博客添加看板娘

错误,那么可以通过降低npm版本,但是如果你不想降低又无法解决依赖问题,那么建议你关闭audit报错,当个鸵鸟,眼不见心不烦。如果你的博客同时部署了不蒜子统计访客的功能,那么可能会出现bug,live2D和不蒜子存在一些兼容问题。删除掉红框中的内容,这样脚注中的访客统计和阅读量统计的冲突就解决了。插件给自己的博客添加一个看板娘,最后的成果图如下。同样的文章的阅读量统计也需要解决,转到路径。安装好模型后,修改站点配置文件。就可以在网站上看到你的看板娘了。我选择的是黑猫模型,也就是。同样把这两行删除,最后。

2023-04-09 16:01:49 198

原创 为博客设置https

我用的是nginx所以这里以nginx为例,nginx的部署分为虚拟主机和独立主机的区别,首先在服务器端判断你的机器属于哪一类,我的服务器是ECS服务器,属于独立主机,刚刚申请到的SSL证书即是阿里云的云盾证书。然后创建一个证书,点击证书申请,填写你的域名,姓名信息后向CA提交申请。待申请成功后,下载证书,然后按照根据你部署方式的不同查阅帮助,在服务器端进行部署。,当然如果你已经配置了80端口,可以将配置的一部分放到80端口的servers中。将下载的压缩包中的两个文件上传到服务器,上传的目录为。

2023-04-07 10:18:25 83

原创 提交个人博客到搜索引擎

就在首页生成了sitemap.xml文件,其中,sitemap.xml是通用的站点地图,而baidusitemap.xml是百度专用的站点地图,我的npm在安装baidu的站点地图的时候出了一点bug,就不管了,反正每次部署都会进行主动推送。输入你的网站,协议头推荐是https协议的,如果你没有https协议后面可能会出现报错,因为hexo会强制把你的链接转为https协议。对于刚建立的博客来说,谷歌往往不能或者不会收录你的博客,为了使自己的博客可以被谷歌所检索到。我选择的是网址模式,输入我的域名。

2023-04-07 10:16:43 84

原创 Unable to find real location for: <frozen importlib._bootstrap>

pydev debugger: Unable to find real location for: pydev debugger: CRITICAL WARNING: This version of python seems to be incorrectly compiled (internal generated filenames are not absolute)pydev debugger: The debugger may still function,

2023-03-01 10:49:32 1943 3

原创 Unable to find real location for: <frozen importlib._bootstrap>

已连接到 pydev 调试器(内部版本号 222.4345.23)pydev debugger: Unable to find real location for:

2023-03-01 10:18:39 883

原创 powershell增加TAP补全功能

Windows下的原生powershell没有自动补全的功能,用着很不舒服,故此提供一个根据历史输入补全,以及git TAP自动补全的功能。具体效果如下:TAP自动补全路径和git命令方向键补全历史输入全局变量的自动补全

2023-02-20 14:55:25 748

原创 ubuntu22wifi固定ip

想在局域网内建立一个自由访问不同电脑的工作环境,但是ubuntu系统有一个问题,通过wifi给ubuntu分配的ip会随着局域网内的环境改变而改变,这样一旦ip改变其他电脑设置的访问路径就要重新修改,很不方便。这篇文章介绍了在没有路由器管理员账号密码的情况下,如何通过ubuntu自带的网络配置工具netplan来固定ubuntu的ip。

2022-11-09 19:48:10 1671

原创 高通量测序的数据处理与分析指北(一)

最近正在学习如何处理高通量测序的数据,我认为要处理高通量测序数,那么对测序原理要有一个清晰的认识,本篇文章介绍了sanger测序,二代测序的测序原理

2022-11-07 11:57:11 3066

原创 Delong检验

用于比较两个ROC曲线的性能,Delong检验是用于AUC面积的显著性检验的。如果两个模型的AUC大小有异但是没有通过Delong检验,那么也不能说明这两个模型有显著的不同。总之,Delong检验就是一种统计学上用于检验AUC显著性的检验方法。

2022-10-26 13:48:56 4851

原创 Kruskal-Wallis检验

在看论文时,常看到Kruskal-Wallis检验,却不知道它具体是一个什么样的检验,这篇文章主要介绍Kruskal-Wallis检验的检验方法,和检验目的,不涉及Kruskal-Wallis检验的证明。

2022-10-26 13:39:00 10736

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除