- 博客(32)
- 收藏
- 关注
原创 ENA下载FASTQ文件
使用prefetch一直下不下来sra,出现错误为timeout exhausted,下载sralite也出现问题,如下代码提取sralite文件下载地址,在第十列。
2024-01-07 17:00:14
821
原创 11.1cellmarker网站记录
传到second.rds(已经做完分群以及差异基因提取后的integrated)本地想画图的时候。cellmaker网址,做GW22。
2023-12-15 14:04:31
140
原创 【无标题】
basename获取文件名后传输到sed命令,s///g标识将第一个空替换成第二个空。如图第一个命令删除SRR,第二个命令将SRR换成了123。basename用法。
2023-12-15 14:03:24
48
原创 kallisto manul
【转录组学】如何进行一步到位的fastq到差异分析,kallisto拯救你(一)使用kallisto命令检查安装的kallisto版本,如下说明已经安装成功。服了,用5.0版本的kallisto就不行,用4.6.1版本的就可以,我服啦~可能是kallisto只能用cDNA文件,下载人类hg38的CDNA文件。从fastq文件开始教你学会简易转录组分析。代码运行中~~~~~
2023-11-14 23:04:37
238
1
原创 【无标题】
但是单细胞normalization用tpm不太好,因为太过稀疏转录数量和基因长度无明显相关性。将RNA的数据scale一下存为second+.rds。count to tpm转化的函数记录一下。
2023-11-12 20:34:33
75
1
原创 11.8 通路水平基因表达分析(单细胞下游分析ReactomeGSA包学习)
‐value cutoff of .05 and a fold‐change cutoff of 2. Gene set enrichment analysis (GSEA) was used for functional enrichment analysis of Kyoto Encyclopedia of Genes and Genomes pathways.对照组和患者组差异基因分析,用的是标准化的基因表达count(应该就是RNA assay里面的data)。一.细胞簇通路水平基因表达包学习。
2023-11-08 20:30:56
728
2
原创 qsub,qstat,qhost
命令格式:qatat [-f][-a][-i] [-n][-s] [-R] [-Q][-q][-B][-u]vf=1.5G #任务的预估内存,内存估计的值应稍微大于真实的内存,内存预估偏小可能会导致节点跑挂。-q #指定要投递到的队列,如果不指定的话,SGE会在用户可使用的队列中选择一个。h=compute-0-15 #指定任务跑在compute-0-15节点上。例:# qstat -f 211 查询作业号为211 的作业的具体信息。-cwd #指定当前路径为工作目录,sge的日志会输出到当前路径。
2023-10-30 23:34:22
486
1
原创 10.30日用late数据跑结果如下,用alldata(70万)内存不够
因为内存不够整合不了所有细胞,因此先取LATE STAGE做分析。%/* 表示从右边开始,删除第一个 / 号及右边的字符。首先把GW25和GW22样本放到单独的LATE文件夹。有时候一个任务传了两次 要删除一个,用qdel。师姐说用qhost看节点,小心把节点跑崩了。
2023-10-30 23:02:35
88
1
原创 代码学习neocortex/R_general/neocortex.R
单细胞数据当中有很多基因的reads数很多,甚至上千,但是有很多基因却是个位数甚至0,那这种数据离散程度也是很大的,但是我们会发现当我们对1000取以10为底的对数时,就变成了3,对10取以10为底的对数时,就变成了1,这样就实现了降低数据离散程度的目的。#加载文件load(file="/kriegsteinlab/data1/aparna/homefiles/cleanedobjects_bysample_June2019/neocortex.RData")#colSum()用于计算矩阵或数组列的综合。
2023-10-16 18:45:01
108
1
原创 看PCA图
样本间有交叉:像垂直xy的z州,三维空间不重叠。分分合合:不同类型样本分开,相同类型样本聚集。许多变量——变量之间有相关关系。转换后这组变量叫主成分。——新生成综合性变量。
2023-10-15 22:02:13
126
1
原创 【无标题】
可以先找一下,命令为conda search fastqc。cut:文本切割,常见参数:-d 指定分隔符。conda env list列出已存在的小环境。#创建名为rnaseq的conda小环境。base环境里最好不要装任何包。删除已创建的小环境及安装的包。不同的软件的以来会相互冲突。启动rnaseq小环境。启动环境——安装软件。
2023-09-13 16:31:13
39
1
原创 shell基础
3.Shell是Linux内置脚本(开发运维、批处理、语法简单,代码写起来轻松,简单易学)2.脚本:一条条文字命令(可见,比如用记事本打开查看编辑)1.shell是一个程序,操作linux的桥梁。既是一种命令语言,又是一种程序设计语言。Javascript是最常见的前端脚本。JSP,PHP(外部开发最常,后端)SQL 标准查询语言,操作数据库的。4.Linux默认的shell是。read -p 提示信息 变量名。Lua 游戏用的比较多。转换它的意思称之为转义。
2023-09-12 14:21:06
35
原创 转录组基本原理与方案设计
给两个样本乘以不同的系数,让大多数相等,这时候还有提高的。问题:人知道谁是内参基因,但是动植物不知道谁是内参基因。解决办法2 :假设大多基因是没有差异表达的(TMM)如何分配多处比对的reads:概率分配(机器学习)3.样本聚类分析:探索样本之间的关系,锁定关键样本。RPKM做法是错的,但是趋势相同,结论是正确的。通过ClusterProfilter软件包来做。5.聚类分析和WGCNA:探索基因与表型的关系。基因见相关系数:找到与已知基因关联的基因。一些特殊情况:全是差异表达基因怎么办?
2023-09-11 21:59:43
304
原创 vi\vim编辑器
vim是vi的加强版本,兼容vi所有指令,还能用shell程序编辑的功能,可以用不同的颜色进行文本编辑/如果文件路径表示文件存在,那么此命令用于编辑已有文件。visual interface 文本编辑器。如果文件不存在,此命令用于编辑新文件。vi\vim编辑器的三种工作模式。
2023-09-10 20:32:27
39
1
原创 echo命令
echo "我当前工作目录为:`pwd`" > work.txt。输出内容比较复杂,用双引号包起来,“”不显示在之后打印的信息。tail test.txt 默认产看尾部十行内容。自动的追加到原来的,显示了最新的更改(程序持续。tail [-f -num] Linux路径。2.反引号` 包围内容以命令执行。-f 持续追踪follow的意思。ctrl c 强制停止命令的运行。1.echo 输出命令。有点像print语句。
2023-09-10 19:45:04
64
1
原创 linux命令学习day2
6.which 查看所使用的一系列命令的程序文件(本质是程序,即windows中的.exe)存放在哪里。颜色不一样(文件夹是深色),ls -l列出后标识为d是文件夹,前面是-是文件。find 起始路径 -size +l-n[KMG]more支持翻页,文件内容过多,可以一页一页展示。rm [-r -f] 参数1 参数2 ……路径必填,-p自动创建不存在的父目录,连续多层。wc [-c -m -l -w] 文件路径。*test* 匹配任何包含test的内容。9.grep [-n] 关键字 文件路径。
2023-09-10 11:27:26
65
1
原创 Linux命令入门
当前登录用户的HOME目录为当前工作目录,个人账户目录(我的房子),路径在:/home/用户名。-a :all的意思,列出全部文件(包含隐藏的文件(前面有一个点)。命令:linux程序,没有图形化页面,可以在命令行(终端中)提供字符化反馈。直接用ls以平铺的形式显示当前目录(默认用户的HOME目录)下的文件(夹)黑马程序员视频的好处:对照图形化(VM中有,就是VM有桌面)ls [ -a -l -h] [linux路径]-l : 以列表(竖向排列)的形式显示内容。以列表的形式显示 路径目录内的内容。
2023-09-09 11:45:29
47
1
原创 远程登录linux+Linux目录系统
通过FinalShell去操作LINUX。只有一个根目录 / ,所有文件都在它下面。3.Linux路径之间的层级关系,用:/2.Linux目录树形结构,只有一个树。ps:windows可以有多个顶级目录。
2023-09-09 11:11:03
40
1
原创 压缩和解压
将123打包到test.tar中,体积没有减少,可以用 ls -l命令查看。将123打包压缩到txt.tar.gz文件中,体积减少。注意:-z有的话一定要在选项第一位,文件后缀跟.gz。-f必须在选项最后,以用来写压缩到哪个文件里。-d用来指定要解压去的位置,同tar中的-C。unzip [-d] 参数。2.解压_也是tar命令。参数中有文件夹要用-r。
2023-09-09 10:41:06
71
1
空空如也
Linux中使用prefetch命令出现如下报错,不能运行
2023-09-13
TA创建的收藏夹 TA关注的收藏夹
TA关注的人