
Linux
马志远的生信笔记
兰州大学草地农业科技学院,青年研究员。欢迎畜牧学硕士报考加入我的团队
展开
-
质控脚本来喽
二代测序结果质控脚本原创 2025-05-12 10:52:57 · 187 阅读 · 0 评论 -
linux使用百度网盘(bypy)
【代码】linux使用百度网盘(bypy)原创 2022-10-30 10:35:06 · 1497 阅读 · 1 评论 -
muscle建树
cat top150.fa|muscle >top150.alignFastTree -nt top150.align >top150.tre原创 2022-04-29 11:41:27 · 672 阅读 · 0 评论 -
diamond用法
#diamond makedb --in ECH2.faa -p 20 -d ECH2#cd /mnt/mzy/dairycow/24samples/mag/genset/raw#for i in MAG*#do#prodigal -i $i -a /mnt/mzy/dairycow/24samples/mag/genset/prodigal/$i.fa -q &#donecd /mnt/mzy/dairycow/24samples/mag/genset/prodigal/#cat *原创 2021-03-11 14:56:23 · 1960 阅读 · 0 评论 -
利用bowtie2和samtools获得reads在基因集上的反贴率
mkdir /mnt/mzy/dairycow/72samples/mag/geneprofilecd /mnt/mzy/dairycow/72samples/mag/geneprofilefor j in 123 98 126 4 128 32 134 8 130 29 131 42 119 19 139 24 125 37 144 14 117 5 142 13 127 22 129 48 138 47 140 20 132 18 149 73 120 105 148 44 122 30 124 2原创 2021-02-23 11:15:48 · 497 阅读 · 1 评论 -
检索方法输出注释结果(第一列为预测基因名,第二列为注释结果)
以下检索gap的两个基因结果:for i in K00134 K00150; do grep $i annotation.emapper.annotations|awk -v i=$i '{print $1"\t"i}'>>test; done注:awk调用变量需要声明原创 2021-01-05 16:37:04 · 292 阅读 · 0 评论 -
给序列名加个计数的小脑袋
某些情况下,一个fa文件中的序列名会有重复,为了避免重复名称带来的困扰,在序列名前/后加个序号也是很常见的手段。原来的文件>MAG1VIAKLEEKPTEPSETDPTEPSETDPTEPSETDPTEPPAPSSDPTEPEPSDPEPSSDPTEPEPSDPEPSSDPEPEPEPSEGGDD*>MAG1MKRERSLALVLSFDTTAAAMETERICGEAGIPGRLFPLPRQLSSDCGIAWASDPADRPRLEALAAAGRIEPAAMTELLL*>M原创 2020-11-03 09:54:04 · 236 阅读 · 0 评论 -
gtdb注释+建树
conda create -n gtdbtk -c bioconda gtdbtkconda activate gtdbtkgtdbtk classify_wf --genome_dir /mnt/mzy/dairycow/24samples/mag/drep/dereplicated_genomes/ --out_dir /mnt/mzy/dairycow/24samples/mag/gtdb --cpus 20 --extension fa原创 2020-09-21 15:16:16 · 2276 阅读 · 0 评论 -
for循环从文件
我做一个文件(names),把所有循环项放进去,这个命令就可以写成for i in $(cat /mnt/mzy/dairycow/sh/names); do .....原创 2020-09-18 20:04:04 · 611 阅读 · 0 评论 -
戴尔服务器新装硬盘
按F2进入BIOS设置,进入设备设置,选择raid设置,设置管理,添加虚拟盘,选中要合并的物理硬盘,把各项都确认了以后点创建物理硬盘。重启后进入系统,查看下硬盘情况sudo fdisk -l找到刚才加载的虚拟盘,格式化一下mkfs.ext4 /dev/sdc尝试加载一下mount /dev/sdc /mnt/6t查看一下成不成df-h没问题的话查uuidblkid写进去vim /etc/fstabUUID=xxxxx /mnt/8t ext.原创 2020-07-18 14:22:02 · 1781 阅读 · 0 评论 -
prodigal预测原核生物基因
prodigal -a protein.fasta -d nucleotide.fasta -o genes.gff -s poteintial.stat -i contig.fasta输入就是-i,可接受标准输入,比如我们先把所有的contigs合在一起cat *.contigs.fa|prodigal -a all.faa -d all.fa原创 2020-06-09 14:04:18 · 994 阅读 · 0 评论 -
从silva文件中获得物种信息
在silva下载的序列文件中,物种注释写在了序列的标题行,也就是">"所在的行,我们要制作一个序列编号和物种注释之间对应的一个表,用以下命令快速完成grep ">" silvaSSU132.dna.fa |sed 's/ /\t/' >silvaSSU132.taxsed -i 's/>//'silvaSSU132.tax...原创 2020-06-05 09:29:44 · 1699 阅读 · 0 评论 -
sed删除指定行
删除某一行(例如第3行)sed -i '1d' file删除区间行(例如2-5行)sed -i '2,5d' file第5-最后一行sed -i '5,d' file行要是间断了怎么办?我还不会(you see what see)原创 2020-05-26 17:56:23 · 776 阅读 · 0 评论 -
ubuntu18.04 安装cuda
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pinsudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600sudo apt-key adv --fetch...原创 2020-04-26 16:24:45 · 804 阅读 · 0 评论 -
ubuntu实时查看各应用的网速
sudo apt install nethogs即nethogs + eno1原创 2020-04-24 10:11:24 · 1097 阅读 · 0 评论 -
服务器配置
系统选择可以是centos,unbuntu这类用的人比较多的,千万别用deepin! 不过呢,还是建议下载一些定制的系统,比如Galaxy(https://usegalaxy.org/),BioLinux(http://environmentalomics.org/bio-linux/),CloudBioLinux(http://cloudbiolinux.org/),Dugong(https...原创 2020-04-13 21:20:13 · 242 阅读 · 0 评论 -
ssh一行登录(带密码)
先安装sshpasssudo apt install sshpass安装完成后,运行以下命令即可直接登录sshpass -p yourpasswords ssh -p 22 usrname@ip也可以把上面的内容写入bashrc中,给个快捷的名词方便调用...原创 2020-03-11 07:49:28 · 7177 阅读 · 0 评论 -
压缩后删除原文件
tar -zcvf aaa.log.tar.gz aaa.log --remove-files原创 2020-03-06 14:15:39 · 1018 阅读 · 0 评论 -
自用的bashrc和vimrc配置
最终设定为用户,时间,路径,且命令在下一行显示vim ~/.bashrc末尾添加一行export PS1="\[\033]2;\h:\u \w\007\033[33;1m\]\u \033[35;1m\t\033[0m \[\033[36;1m\]\w\[\033[0m\]\n\[\e[32;1m\]$ \[\e[0m\]";...原创 2020-03-05 18:26:05 · 1053 阅读 · 0 评论 -
查找压gz缩包中文件内容
zgrep -c "words" xxx.gzless xxxx.gz|grep -c "word"zgrep的速度要显著快过less这个原创 2020-03-04 21:53:18 · 712 阅读 · 0 评论 -
ubuntu用户切换
从一般用户切换到root用户sudo -i从root用户切换到普通用户su username原创 2020-03-04 16:04:06 · 400 阅读 · 0 评论 -
利用bowtie2去除宿主基因
从NCBI下载牛基因组,下载后gunzip解压wget ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/002/263/795/GCF_002263795.1_ARS-UCD1.2/GCF_002263795.1_ARS-UCD1.2_genomic.fna.gz安装bowtie2sudo apt-get install bowtie2构建...原创 2020-03-01 22:46:25 · 6715 阅读 · 0 评论 -
find命令
查找当前文件夹中*.gz文件ls|grep -c "gz" #计算有多少个gz文件find $pwd *.gz|grep -c "gz" find /. *.gz原创 2020-02-18 22:44:34 · 276 阅读 · 0 评论 -
lftp脚本下载
#!/bin/bash#SFTP配置信息#用户名USER=temp01#密码PASSWORD=temp123#待下载文件根目录SRC_DIR=/mnt/10t/mzy/rawdata/#FTP目录DES_DIR=/Disk01/users/wangyu/miudong/data/mazhiyuan/#IPIP=210.22.121.250 #发送文件 (关键部分)lf...原创 2020-02-14 23:09:42 · 290 阅读 · 0 评论 -
deepin配置vim,解决不能用鼠标粘贴的问题
网上查了一堆解决方法,升级vim到8.0,安装vim-gtk什么的都不靠谱,原来是vim配置的问题,没有打开鼠标支持,但是也不能按照有些人说的,直接修改/etc/vim/vimrc这个文件,修改了照样不起作用(不知道为啥)。只需要在自己的根目录下创建一个vim配置文件即可,代码如下vim ~/.vimrc#插入一行set mouse-=a这么简单配置,完美解决。坑爹的deepin,基...原创 2020-02-11 11:46:04 · 1777 阅读 · 0 评论 -
编辑bash中的alias
vim ~/.bashrcalias ll='ls -alF' #插入一行source ~/.bashrc原创 2020-02-10 23:13:39 · 389 阅读 · 0 评论 -
eggNOG注释蛋白序列
下载软件(其实就是一堆脚本)git clone https://github.com/jhcepas/eggnog-mapper.git下载数据库alias python=/usr/bin/python2.7python download_eggnog_data.py 拆分蛋白文件xx.faaawk '!/^>/ { printf "%s", $0; n = "\...原创 2020-04-23 14:41:47 · 939 阅读 · 0 评论 -
利用vsearch配合usearch合成OTU表,并用mothur软件做后续分析
下载RDP训练集https://www.mothur.org/wiki/RDP_reference_files#Version_14训练集小写转成大写cat trainset16_022016.pds.fasta | tr a-z A-Z >trainset16.fasta安装vsearch\usearch\mothur解压序列文件gzip -d *.gz重命名fq文件...原创 2018-12-03 20:51:39 · 4899 阅读 · 0 评论 -
图像输出常用设置
ggplot2输出:pdf格式,6*4英寸(带图例)AI修正:坐标值14,图例字体18pt,标题14,字体times new roman新加入图案,描边1pt,导出CMYK配色原创 2018-11-22 14:45:35 · 285 阅读 · 0 评论 -
ubuntu安装中文输入法(搜狗)
Ubuntu自带的中文输入法体验奇差,偶尔发现搜狗居然有linux版本的,更新还很快。1. 官网下载最新版本的文件,双击后安装(为数不多在linux下看见双击能安装)。2.如果系统用的是ibus的话需要修改成fcitx,系统默认语言不是中文的话要取消输入法语言限制,按照以下步骤一并解决了:im-config点ok,选fcitx,注销电脑重新登录;fcitx-config-gtk3点左下角+,取消O...原创 2018-07-13 21:39:16 · 331 阅读 · 0 评论 -
合成mothur的group文件
用mothur和qiime处理序列的方法不一样,qiime是把样品信息写在了序列文件中,mothur是利用一个group文件。group文件包含两列,一列是序列名,另外一列是对应的样品名。合成这个文件就不要想着用excel这类软件了。以公司给的测序数据为例:这个很明显是qiime拆分的样品,“@”后是给出新的序列名,包含了样品信息“25”,“-”后是给了一个串号区别序列,M03...是序列...原创 2018-07-18 16:35:52 · 587 阅读 · 1 评论