爱学习Guocc-优快云博客

转载【转载】无参转录组GO、KEGG富集分析——diamond+idmapping+GOstats

原文链接–>此处起飞（1）用无参转录组分析软件得到unigene fasta文件，命名为my_unigenes.fa，格式如下表所示：>MSTRG.5.1 gene=MSTRG.5TGATGTCATCGATCCGTGACGTTTAGTATTCAACCAATAGGAATCAACCACGTAGGATTGGCGATCCTCGTCAAACGTGTAAACGGTAGATCTGAACCGTTGACTGGCTGAGAGAAAACACATATTGTGGTATTTTAGTCGGTACGATTAAGAA

2021-08-30 15:23:36 6005 2

原创【Linux】Latex的安装-源码

【Linux】Latex的安装latex安装包下载安装选择一般推荐的Latex安装需要root权限，为了找这个源码包找了很久，在此记录一下。latex安装包下载wget http://mirror.ctan.org/systems/texlive/tlnet/install-tl-unx.tar.gzmv install-tl-unx.tar.gz texlive.tar.gztar zxvf texlive.tar.gzcd texlive./install-tl 安装选择该包在

2021-03-10 10:56:23 513

原创【C库】version `GLIBCXX_3.4.21‘ not found 报错解决

【C库】version `GLIBCXX_3.4.21' not found 报错解决用户自定义安装查了很多资料，都是推荐yum来安装apt-get install libstdc++6 #或者yum install libstdc++6 但是很多时候，我们都是用的集群，根本不可能有root权限。用户自定义安装找了很久没找到下载链接，记录一下；下载与安装命令如下wget http://ftp.gnu.org/gnu/glibc/glibc-2.15.tar.gztar zxvf

2021-03-09 21:55:01 701

原创【perl语言】安装报错 [IO.o] Error 1

【perl语言】安装报错 [IO.o] Error 1网上找了很久的资料，最后发现，只要把C_INCLUDE_PATH变量值去掉就可以，简单粗暴。unset C_INCLUDE_PATH

2021-03-09 21:21:49 316

原创【pyhton报错】ModuleNotFoundError: No module named ‘_ctypes‘

【pyhton报错】ModuleNotFoundError: No module named '_ctypes'libffi的安装Python的重新编译在安装python的模块时，报以上错误，需要安装libffi包。libffi的安装wget https://github.com/libffi/libffi/releases/download/v3.3/libffi-3.3.tar.gztar zxvf libffi-3.3.tar.gzcd libffi-3.3./configure --pr

2021-03-09 17:11:01 405

原创【LINUX】libgd-GD库安装

GD库的安装GD依赖库-zlibGD依赖库-libpngGD依赖库-libjpegGD依赖库-freetypeGD依赖库-liblzmaGD依赖库-libxml2GD依赖库-fontconfigGD安装--第一次安装近日帮朋友安装GD库一直失败，安装所需要的依赖库很多。本来放弃了，今天发现自己想要circos画图，也需要GD模块。在此记录自己的安装过程，以防下次安装碰到安装问题。按照以下步骤按照依赖库就可以，报错信息一般都是上一步的库未安装。GD依赖库-zlibwget http://ww

2021-03-05 20:44:23 5572

原创【降解组分析】利用CleaveLand4进行降解组分析

降解组分析流程CleaveLand4软件安装CleaveLand4软件使用CleaveLand4例子降解组的分析，目前主流的软件为CleaveLand4，他可以通过测序数据来寻找miRNA与基因的剪切位点，从而验证miRNA靶基因的准确性。CleaveLand4软件安装该软件安装非常简单，网址在这，我们只需通过git clone即可对其进行下载。git clone https://github.com/MikeAxtell/CleaveLand4.git该软件依赖多个软件，我们需要提前

2021-02-23 10:07:44 1502

原创【GO富集分析】GO注释文件爬取

GO数据库注释文件爬取爬取整体思路代码实现最近在做基因富集分析发现，很多非模式植物通过clusterprofiler做富集分析都需要自备注释文件，这时我们需要GO的注释文件，需要自己整理，这里通过python来爬取GO数据库来制作注释所需的文件。爬取整体思路通过观察GO的网址，我们不难发现，整个网页的网址格式是固定的，如http://amigo.geneontology.org/amigo/term/GO:0000004，网址前面都是，http://amigo.geneontology.org/

2021-01-24 17:26:11 1358 2

原创 Dbus启动问题 Failed to get D-Bus connection: Operation not permitted

最近在服务器看到，abrt-action-gen服务一直在跑，且占用较多内存，经查询后发现是abrtd服务出现问题，用systemctl erestart abrtd。systemctl erestart abrtd 的报错如图，一直提示 Failed to get D-Bus connection: Operation not permitted，这表明我们有可能没安装D-Bus，或者D-Bus服务没启动dbus服务启动dbus的目录大概在/bin目录，我们需要切到到该目录进行启动服务c

2020-11-18 12:38:37 8862 2

原创基因家族分析《三》

基因的染色体定位分析利用tbtools的 Gene Location Visualize From GTF/GFF工具，对染色体进行位置的绘制，这种是棒状的染色体图。若想要圈图的展示形式，可以选择Circle Gene View。

2020-11-09 15:59:23 4079 4

原创基因家族分析《二》

找到 ”Batch-CDD"工具，输入上一步获得的hitdata.txt文件，以及蛋白序列文件，点击"start“，对其结构进行可视化；

2020-11-06 11:35:04 4609 1

原创用tbtools基因家族分析《一》

基因家族分析流程蛋白序列的blast比对候选蛋白序列的提取候选基因的保守结构域确定此版本为无代码版本，依赖tbtools来实现，纯粹记录自己的学习经验。蛋白序列的blast比对选择拟南芥基因家族的蛋白序列文件选择你想要查找的基因家族的基因组蛋白文件选择你要输出的文件名选择输出格式，默认为xml，选择"Table“格式，结果更直观点击”start“，开始运行。候选蛋白序列的提取对于我们获得的结果文件rice.txt,，我们选择用excel打开，对其进行排序和去重处理，得到候选的基因I

2020-11-05 21:29:12 11215 1

原创【perl语言】利用threads实现多线程运算

代码如下#!/usr/bin/env perl use strict;use threads;use Thread::Semaphore;my $trait = $ARGV[0];my $NumOfTrait = 0;my $thread;my $max_cpu = 28;my $semaphore = new Thread::Semaphore($max_cpu);my (@line, @line, %traitDict, $i);open REF, "taxa_".$trait

2020-10-03 17:36:27 704

原创 SraToolkit工具下载与安装

SraToolkit 下载与安装第一步：进入NCBI选择“Download”, 进入后选择“Download Tools”工具下载。第二步：选择“SRA Toolkit”的“Download”按钮，进入版本选择，此处我选择的是“CentOS Linux 64 bit architecture ”，若想在linux系统中下载，可选择右键“复制链接地址”，然后到linux系统中用wget命令获取。第三步：安装与使用第一步：进入NCBI选择“Download”, 进入后选择“Download Tools”工具下

2020-09-14 09:42:29 7132 1

原创【R语言】parallel实现多线程

R语言使用parallel实现并行运算parallel的用法小小建议由于最近用R语言跑的数据比较多，且都是重复的操作，跑一次时间长，所以尝试了下并行运算，所用的包为parallel，使用简单，易于上手。parallel的用法parallel包的用法非常简单，我们只需要将原本的apply()改为parApply()，lapply()改为parLapply()，然后在函数前面加上初始化线程和结束线程的语句即可。我们可以通过detectCores()来检查我们自己电脑（或者服务器）的总线程数，并对其进行

2020-08-31 22:14:05 2833 1

原创【群体结构】structure结构图绘制

R语言绘制structure图输入文件准备R语言代码上一篇文章：【群体结构】CLUMPP软件使用前面讲到利用CLUMPP合并多个K值的结果，这边主要叙述R语言绘制structure图。代码相对简单，我主要利用R语言的低级函数rect()完成。输入文件准备包含四列，第1列名字（也可以去掉），第2-4列为K的成分比例。R语言代码导入文件名为plot.clumpp.txt，格式如上。通过循环每一行，将不同的列的值进行绘制方块，达到效果。plotData<-read.table("plo

2020-06-11 10:35:26 5794

原创【群体结构】CLUMPP软件使用

CLUMPP的使用CLUMPP的安装CLUMPP的使用最近在做群体结构分析，群体结构三剑客：structure、pac和kinship。这边我主要用的软件是structure，毕竟比较老牌，正常一个K值只要1天时间，我感觉还能接受。在structure获得输出结果后，需要利用CLUMPP对多次循环的K矩阵进行合并。CLUMPP的安装官网网址：https://web.stanford.edu/group/rosenberglab/clumpp.html，进行简单的一个注册之后，就可以跳转到下载链接。下

2020-06-11 10:22:45 3912

weixin_43840576的博客

转载【转载】无参转录组GO、KEGG富集分析——diamond+idmapping+GOstats

原创【Linux】Latex的安装-源码

原创【C库】version `GLIBCXX_3.4.21‘ not found 报错解决

原创【perl语言】安装报错 [IO.o] Error 1

原创【pyhton报错】ModuleNotFoundError: No module named ‘_ctypes‘

原创【LINUX】libgd-GD库安装

原创【降解组分析】利用CleaveLand4进行降解组分析

原创【GO富集分析】GO注释文件爬取

原创 Dbus启动问题 Failed to get D-Bus connection: Operation not permitted

原创基因家族分析《三》

原创基因家族分析《二》

原创用tbtools基因家族分析《一》

原创【perl语言】利用threads实现多线程运算

原创 SraToolkit工具下载与安装

原创【R语言】parallel实现多线程

原创【群体结构】structure结构图绘制

原创【群体结构】CLUMPP软件使用

原创【转录组】基因定量分析 featureCounts的使用

原创结构变异SV的鉴定--smartie-sv与bayestyper

原创 Linux系统openssl库的安装与报错处理

原创 [Python] python的简单数据处理

原创浅谈富集分析的Pvalue

原创 vcftools安装碰到的坑

原创利用PfamScan寻找同源基因家族

原创【Python】利用lxml爬取起点小说网小说

原创使用perl计算fasta序列长度

python简单数据处理

空空如也