
linux
文章平均质量分 53
学生信的大叔
生信分析工程师
展开
-
conda 更换镜像究极方法
conda安装软件一直用的北外镜像,但是我租的服务器机构IP好像最近被屏蔽了,一直无法使用。机构内部搭了本地镜像。在更换本地镜像(修改.condarc文件)后,新建环境可以正常使用本地镜像,但是之前建的环境依旧还在沿用北外镜像,无法安装软件。原创 2025-03-02 11:39:56 · 454 阅读 · 0 评论 -
Make 学习笔记:转录组流程搭建
在当前工作目录建立Raw_datainputResult文件夹。原始数据将下载在Raw_data下,经过下载/重命名等处理后放于input文件夹中。./├── input├── Result以转录组项目PRJEB37155,人的9个转录组为例。注意:这里PE测序数据后缀名是与input/...原创 2024-10-29 17:31:01 · 343 阅读 · 0 评论 -
eval与bash -c 的区别与联系
eval和bash -c都可以用来在 Linux shell 脚本中执行命令字符串,但它们在使用方式和应用场景上有所不同。eval。原创 2024-07-07 20:15:06 · 452 阅读 · 0 评论 -
利用linux中awk从gtf文件中提取外显子的bed文件
0 为第1个碱基,100表示第101个碱基,但是不包含第101个碱基,因此这个写法表示位置1到100。其中,feature起始与结束为左闭右开区间,即表示第1到第100个碱基可以理解为数学上的区间。由于bed文件起始位置要从0开始,与gtf文件不同,所以在打印时起始位点要减去1,即。即为将基因ID,转录本ID和exon number拼接在了一起,以保留更多内容。这里将基因ID ,转录本ID和exon编号做一些处理,在后续。利用awk从gtf文件中提取exon的bed文件。这里时可以直接进行减法运算的。原创 2024-06-03 00:23:54 · 542 阅读 · 0 评论 -
利用linux中sed给染色体编号加前缀chr
在做生信分析的时候,很多情况下我个人倾向于从ENSEMBL下载基因组,但是这个数据库的染色体编号为数字,而一些f分析软件会要求chr前缀。这里演示下如何进行给gtf文件和基因组添加chr前缀。查看gtf染色体前缀。查看基因组染色体前缀。原创 2024-06-03 00:15:34 · 565 阅读 · 0 评论 -
28.2 Gb基因组SSR序列知多少:Misa+Primer3流程
前两天帮人下载了28.2Gb的蝾螈基因组,这么大的基因组,还是第一次近距离接触。由于之前我优化了下流程脚本,使之可以耗费较小的服务器资源用于分析核心基因组SSR并设计引物。目前为止,我接过的付费分析中还没有超过3Gb的基因组,因此,萌生了对蝾螈基因组分析SSR并设计引物的想法。就现在网上公开的脚本和修改方法,并不能直接完美将流程应用于核心基因组的分析。如果你有需要分析的,可以直接联系我做付费分析。原创 2024-06-01 23:46:46 · 559 阅读 · 0 评论 -
linux 图像格式转换: pdf转png格式
试了下R将pdf矢量图转换为png位图,不如linux下convert方便好用。原创 2024-02-15 09:30:59 · 760 阅读 · 0 评论 -
FPKM转TPM脚本分享:当Shell脚本嵌入R代码
当然,我之前写过一个R脚本模板,可以只依赖基础函数也允许使用长选项设定参数,也可以设定缺省值,详见《等工具来设定选项和缺省值,这些工具在常用系统环境中是默认配置,因此使得脚本更加灵活【下面脚本并未这样写,大家可以自己改写】。输入文件:FPKM表达矩阵,行名为基因,列名为样本名称,值为FPKM。我个人的看法是,还是有一点用处的。当Shell脚本中嵌入R代码,这到底是R脚本,还是shell脚本呢?shell中写R代码的一些细节,了解的还不够详细,需要多写多练。格式,因为是特定情境下的脚本,所以卡的比较严格。原创 2024-02-15 09:29:45 · 537 阅读 · 0 评论 -
linux解压zip格式的新姿势
周六接到一个小项目,客户把4例样本的clean数据放到一个名为clean.zip的文件中。客户是通过百度网盘给的数据。由于客户比较着急要数据,所以直接使用bypy把clean.zip下载到远程服务器上。查看文件【前提是已经配置好bypy。配置过程自行搜索】下载文件一般来说解压zip格式,可能会直接使用unzip。原创 2024-01-22 00:54:24 · 411 阅读 · 0 评论