- 博客(26)
- 资源 (1)
- 收藏
- 关注
转载 【转载】无参转录组GO、KEGG富集分析——diamond+idmapping+GOstats
原文链接–>此处起飞(1) 用无参转录组分析软件得到unigene fasta文件,命名为my_unigenes.fa,格式如下表所示:>MSTRG.5.1 gene=MSTRG.5TGATGTCATCGATCCGTGACGTTTAGTATTCAACCAATAGGAATCAACCACGTAGGATTGGCGATCCTCGTCAAACGTGTAAACGGTAGATCTGAACCGTTGACTGGCTGAGAGAAAACACATATTGTGGTATTTTAGTCGGTACGATTAAGAA
2021-08-30 15:23:36
6005
2
原创 【Linux】Latex的安装-源码
【Linux】Latex的安装latex安装包下载安装选择一般推荐的Latex安装需要root权限,为了找这个源码包找了很久,在此记录一下。latex安装包下载wget http://mirror.ctan.org/systems/texlive/tlnet/install-tl-unx.tar.gzmv install-tl-unx.tar.gz texlive.tar.gztar zxvf texlive.tar.gzcd texlive./install-tl 安装选择该包在
2021-03-10 10:56:23
513
原创 【C库】version `GLIBCXX_3.4.21‘ not found 报错解决
【C库】version `GLIBCXX_3.4.21' not found 报错解决用户自定义安装查了很多资料,都是推荐yum来安装apt-get install libstdc++6 #或者yum install libstdc++6 但是很多时候,我们都是用的集群,根本不可能有root权限。用户自定义安装找了很久没找到下载链接,记录一下;下载与安装命令如下wget http://ftp.gnu.org/gnu/glibc/glibc-2.15.tar.gztar zxvf
2021-03-09 21:55:01
701
原创 【perl语言】安装报错 [IO.o] Error 1
【perl语言】安装报错 [IO.o] Error 1网上找了很久的资料,最后发现,只要把C_INCLUDE_PATH变量值去掉就可以,简单粗暴。unset C_INCLUDE_PATH
2021-03-09 21:21:49
316
原创 【pyhton报错】ModuleNotFoundError: No module named ‘_ctypes‘
【pyhton报错】ModuleNotFoundError: No module named '_ctypes'libffi的安装Python的重新编译在安装python的模块时,报以上错误,需要安装libffi包。libffi的安装wget https://github.com/libffi/libffi/releases/download/v3.3/libffi-3.3.tar.gztar zxvf libffi-3.3.tar.gzcd libffi-3.3./configure --pr
2021-03-09 17:11:01
405
原创 【LINUX】libgd-GD库安装
GD库的安装GD依赖库-zlibGD依赖库-libpngGD依赖库-libjpegGD依赖库-freetypeGD依赖库-liblzmaGD依赖库-libxml2GD依赖库-fontconfigGD安装--第一次安装近日帮朋友安装GD库一直失败,安装所需要的依赖库很多。本来放弃了,今天发现自己想要circos画图,也需要GD模块。在此记录自己的安装过程,以防下次安装碰到安装问题。按照以下步骤按照依赖库就可以,报错信息一般都是上一步的库未安装。GD依赖库-zlibwget http://ww
2021-03-05 20:44:23
5572
原创 【降解组分析】利用CleaveLand4进行降解组分析
降解组分析流程CleaveLand4软件安装CleaveLand4软件使用CleaveLand4例子降解组的分析,目前主流的软件为CleaveLand4,他可以通过测序数据来寻找miRNA与基因的剪切位点,从而验证miRNA靶基因的准确性。CleaveLand4软件安装该软件安装非常简单,网址在这,我们只需通过git clone即可对其进行下载。git clone https://github.com/MikeAxtell/CleaveLand4.git该软件依赖多个软件,我们需要提前
2021-02-23 10:07:44
1502
原创 【GO富集分析】GO注释文件爬取
GO数据库注释文件爬取爬取整体思路代码实现最近在做基因富集分析发现,很多非模式植物通过clusterprofiler做富集分析都需要自备注释文件,这时我们需要GO的注释文件,需要自己整理,这里通过python来爬取GO数据库 来制作注释所需的文件。爬取整体思路通过观察GO的网址,我们不难发现,整个网页的网址格式是固定的,如http://amigo.geneontology.org/amigo/term/GO:0000004,网址前面都是,http://amigo.geneontology.org/
2021-01-24 17:26:11
1358
2
原创 Dbus启动问题 Failed to get D-Bus connection: Operation not permitted
最近在服务器看到,abrt-action-gen服务一直在跑,且占用较多内存,经查询后发现是abrtd服务出现问题,用systemctl erestart abrtd。systemctl erestart abrtd 的报错如图,一直提示 Failed to get D-Bus connection: Operation not permitted,这表明我们有可能没安装D-Bus,或者D-Bus服务没启动dbus服务启动dbus的目录大概在/bin目录,我们需要切到到该目录进行启动服务c
2020-11-18 12:38:37
8862
2
原创 基因家族分析《三》
基因的染色体定位分析利用tbtools的 Gene Location Visualize From GTF/GFF工具,对染色体进行位置的绘制,这种是棒状的染色体图。若想要圈图的展示形式,可以选择Circle Gene View。
2020-11-09 15:59:23
4079
4
原创 基因家族分析《二》
找到 ”Batch-CDD"工具,输入上一步获得的hitdata.txt文件,以及蛋白序列文件,点击"start“,对其结构进行可视化;
2020-11-06 11:35:04
4609
1
原创 用tbtools基因家族分析《一》
基因家族分析流程蛋白序列的blast比对候选蛋白序列的提取候选基因的保守结构域确定此版本为无代码版本,依赖tbtools来实现,纯粹记录自己的学习经验。蛋白序列的blast比对选择拟南芥基因家族的蛋白序列文件选择你想要查找的基因家族的基因组蛋白文件选择你要输出的文件名选择输出格式,默认为xml,选择"Table“格式,结果更直观点击”start“,开始运行。候选蛋白序列的提取对于我们获得的结果文件rice.txt,,我们选择用excel打开,对其进行排序和去重处理,得到候选的基因I
2020-11-05 21:29:12
11215
1
原创 【perl语言】利用threads实现多线程运算
代码如下#!/usr/bin/env perl use strict;use threads;use Thread::Semaphore;my $trait = $ARGV[0];my $NumOfTrait = 0;my $thread;my $max_cpu = 28;my $semaphore = new Thread::Semaphore($max_cpu);my (@line, @line, %traitDict, $i);open REF, "taxa_".$trait
2020-10-03 17:36:27
704
原创 SraToolkit工具下载与安装
SraToolkit 下载与安装第一步:进入NCBI选择“Download”, 进入后选择“Download Tools”工具下载。第二步:选择“SRA Toolkit”的“Download”按钮,进入版本选择,此处我选择的是“CentOS Linux 64 bit architecture ”,若想在linux系统中下载,可选择右键“复制链接地址”,然后到linux系统中用wget命令获取。第三步:安装与使用第一步:进入NCBI选择“Download”, 进入后选择“Download Tools”工具下
2020-09-14 09:42:29
7132
1
原创 【R语言】parallel实现多线程
R语言使用parallel实现并行运算parallel的用法小小建议由于最近用R语言跑的数据比较多,且都是重复的操作,跑一次时间长,所以尝试了下并行运算,所用的包为parallel,使用简单,易于上手。parallel的用法parallel包的用法非常简单,我们只需要将原本的apply()改为parApply(),lapply()改为parLapply(),然后在函数前面加上初始化线程和结束线程的语句即可。我们可以通过detectCores()来检查我们自己电脑(或者服务器)的总线程数,并对其进行
2020-08-31 22:14:05
2833
1
原创 【群体结构】structure结构图绘制
R语言绘制structure图输入文件准备R语言代码上一篇文章:【群体结构】CLUMPP软件使用前面讲到利用CLUMPP合并多个K值的结果,这边主要叙述R语言绘制structure图。代码相对简单,我主要利用R语言的低级函数rect()完成。输入文件准备包含四列,第1列名字(也可以去掉),第2-4列为K的成分比例。R语言代码导入文件名为plot.clumpp.txt,格式如上。通过循环每一行,将不同的列的值进行绘制方块,达到效果。plotData<-read.table("plo
2020-06-11 10:35:26
5794
原创 【群体结构】CLUMPP软件使用
CLUMPP的使用CLUMPP的安装CLUMPP的使用最近在做群体结构分析,群体结构三剑客:structure、pac和kinship。这边我主要用的软件是structure,毕竟比较老牌,正常一个K值只要1天时间,我感觉还能接受。在structure获得输出结果后,需要利用CLUMPP对多次循环的K矩阵进行合并。CLUMPP的安装官网网址:https://web.stanford.edu/group/rosenberglab/clumpp.html,进行简单的一个注册之后,就可以跳转到下载链接。下
2020-06-11 10:22:45
3912
原创 【转录组】基因定量分析 featureCounts的使用
featureCounts的使用featureCounts的安装featureCounts的使用featureCounts的安装在转录组进行统计基因count数的时候,Htseq-count与featureCounts为使用最多的软件,其中htseq-count的速度较慢,而featureCounts的最大特点就是快。下载与安装$ wget https://jaist.dl.sourceforge.net/project/subread/subread-1.6.0/subread-1.6.0-L
2020-06-03 16:53:10
8339
原创 结构变异SV的鉴定--smartie-sv与bayestyper
SV鉴定软件--smartie-sv和BayesTyper的使用smartie-sv的安装1. smartie-sv的安装,需要依赖htslib和blasr2. hstlib的安装3. blasr的安装4. smartie-sv的配置5. smartie-sv的使用6. 运行结果bayesTyper的安装1. bayesTyper安装2. Platypus的安装3. manta的安装:4. ba...
2020-05-05 17:30:42
4498
2
原创 Linux系统openssl库的安装与报错处理
openssl库的安装与报错安装报错安装因为最近因为其他软件需要Pyhton 2.7,所以在安装过程中碰到不少的坑,其中opensll就是一个,python的安装需要ssl模块的支持,才能编译出pip,很多时间都会报错。安装方法有两种,第一种很简单;yum install openssl-devel第二种则是源码安装,常规的安装过程是:下载安装包https://www.open...
2020-05-04 22:04:31
6171
原创 [Python] python的简单数据处理
利用python简单处理Excel数据Excel数据的导入数据的简单统计数据的展示--直方图python的功能非常强大,在excel数据的读取与处理也有相应的模块可以实现。在这里,我主要展示如何利用pandas以及matplotlib模块来实现对excel数据的读取,以及数据的简单可视化。模块pandas和matplotlib的安装可采用pip install pandaspip in...
2020-05-03 00:00:59
853
原创 浅谈富集分析的Pvalue
浅谈富集分析的Pvalue引言超几何分布Python计算超几何分布引言今天给大家带来一个关于“撒币“的问题,说起”撒币“,最经典就是二项分布,也就是你拿起一枚硬币抛向空中,当它转体n个360°,最后华丽的落在地上,出现正面或者反面的概率。具体的一些计算公式各位可自行找度娘索要。除“撒币“问题,在数学中也有一个很好玩的实验,叫“取球实验”,也是就是在盒子里有黑球黑球黑球黑球白球白球白球…,当...
2020-05-02 01:31:28
8655
原创 vcftools安装碰到的坑
在群体遗传学相关的系数计算这一块,vcftools是个很好的工具,操作简单,可以从变异检测的vcf出发,直接计算Pi系数,TajimaD系数以及Fst系数,还是比较方便。在老版本不支持vcf4.2的情况下,可以选择安装新版vcftools。下载地址为:https://sourceforge.net/projects/vcftools/files/以最新版本0.1.13版本为例,首先我们需要下...
2019-04-04 16:05:36
5300
5
原创 利用PfamScan寻找同源基因家族
Pfam是一个蛋白家族数据库,其中Pfam-A是手工确定的高质量的蛋白家族,Pfam-B是自动注释的,是对A的补充。目前已更新到32.0,下载地址为ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/,任选一版本即可。做保守结构蛋白的注释Domains,需要用到PfamScan软件,以及Pfam-A的数据库。安装后的PfamScan目录下主要有三个文件...
2019-01-22 09:53:35
8215
2
原创 【Python】利用lxml爬取起点小说网小说
先写在前面,人生苦短,我用python。此文作为自己的一个小笔记,记录自己的爬虫的一些东西,此处为为爬取起点小说网的首页的全部小说,使用语言python,使用库lxml以及requests。#!/usr/bin/env python#!-*-coding:utf-8 -*-#!@Time :2018/12/7 21:11#!@Author :Guocc#!@File ...
2018-12-07 23:33:17
1261
原创 使用perl计算fasta序列长度
Fasta序列长度的计算的原理就是将不同染色体长度存入哈希,最后用length去计算哈希元素的长度。perl脚本如下:#!/usr/bin/env perluse strict;my($name, %seq );open IN, $ARGV[0];die “Need the inut fasta.” if( ! defined $ARGV[0] );while(){chomp;i...
2018-12-03 17:34:01
3450
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人