自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 处理Ribotricer输出文件

【代码】处理Ribotricer输出文件。

2024-07-20 22:50:51 152

原创 【无标题】

linux中去掉每行=之前的字符串。linux中提取包含指定字符的列。

2024-06-05 10:32:54 136

原创 Linux文件提取信息学习

去掉fastq序列保存到ridfa.txt。查看含有如下ENSG的行。

2024-04-09 16:14:37 292

原创 bulk的热图和火山图

【代码】bulk的热图和火山图。

2024-01-22 11:37:39 564

原创 ENA下载FASTQ文件

使用prefetch一直下不下来sra,出现错误为timeout exhausted,下载sralite也出现问题,如下代码提取sralite文件下载地址,在第十列。

2024-01-07 17:00:14 821

原创 【无标题】

思路:使用UCSC下载标准10X文件再添加meta信息再提取表达的假基因。2.提取表达的假基因。

2023-12-30 20:22:31 363

原创 平均表达量

【代码】平均表达量。

2023-12-21 12:19:54 462

原创 这是哪个阶段的图这么好看

2023-12-15 14:07:10 44

原创 11.1cellmarker网站记录

传到second.rds(已经做完分群以及差异基因提取后的integrated)本地想画图的时候。cellmaker网址,做GW22。

2023-12-15 14:04:31 140

原创 11.4提取假基因

第二种直接提假基因文件的方法。

2023-12-15 14:04:03 62

原创 【无标题】

basename获取文件名后传输到sed命令,s///g标识将第一个空替换成第二个空。如图第一个命令删除SRR,第二个命令将SRR换成了123。basename用法。

2023-12-15 14:03:24 48

原创 细胞注释+细胞占比图

下一步工作:筛选表达的假基因。

2023-12-15 02:40:37 132

原创 python if-elif-else

else可以不写,相当于N个独立if。条件判断后空格缩进不可以省略。

2023-12-11 14:47:05 86 1

原创 kallisto(3) 定量

【代码】kallisto(3) 定量。

2023-11-16 16:18:00 374 1

原创 kallisto manul

【转录组学】如何进行一步到位的fastq到差异分析,kallisto拯救你(一)使用kallisto命令检查安装的kallisto版本,如下说明已经安装成功。服了,用5.0版本的kallisto就不行,用4.6.1版本的就可以,我服啦~可能是kallisto只能用cDNA文件,下载人类hg38的CDNA文件。从fastq文件开始教你学会简易转录组分析。代码运行中~~~~~

2023-11-14 23:04:37 238 1

原创 Seurat添加分组

如图metadata成功出现tissue分组。

2023-11-12 21:53:40 4786 2

原创 【无标题】

但是单细胞normalization用tpm不太好,因为太过稀疏转录数量和基因长度无明显相关性。将RNA的数据scale一下存为second+.rds。count to tpm转化的函数记录一下。

2023-11-12 20:34:33 75 1

原创 11.8 通路水平基因表达分析(单细胞下游分析ReactomeGSA包学习)

‐value cutoff of .05 and a fold‐change cutoff of 2. Gene set enrichment analysis (GSEA) was used for functional enrichment analysis of Kyoto Encyclopedia of Genes and Genomes pathways.对照组和患者组差异基因分析,用的是标准化的基因表达count(应该就是RNA assay里面的data)。一.细胞簇通路水平基因表达包学习。

2023-11-08 20:30:56 728 2

原创 11/2完成和待完成工作

假基因查询的网站,都是没有提供下载list的窗口。完成GW22的初步注释(写了name.r)

2023-11-02 16:40:18 83 1

原创 qsub,qstat,qhost

命令格式:qatat [-f][-a][-i] [-n][-s] [-R] [-Q][-q][-B][-u]vf=1.5G #任务的预估内存,内存估计的值应稍微大于真实的内存,内存预估偏小可能会导致节点跑挂。-q #指定要投递到的队列,如果不指定的话,SGE会在用户可使用的队列中选择一个。h=compute-0-15 #指定任务跑在compute-0-15节点上。例:# qstat -f 211 查询作业号为211 的作业的具体信息。-cwd #指定当前路径为工作目录,sge的日志会输出到当前路径。

2023-10-30 23:34:22 486 1

原创 10.30日用late数据跑结果如下,用alldata(70万)内存不够

因为内存不够整合不了所有细胞,因此先取LATE STAGE做分析。%/* 表示从右边开始,删除第一个 / 号及右边的字符。首先把GW25和GW22样本放到单独的LATE文件夹。有时候一个任务传了两次 要删除一个,用qdel。师姐说用qhost看节点,小心把节点跑崩了。

2023-10-30 23:02:35 88 1

原创 代码学习neocortex/R_general/neocortex.R

单细胞数据当中有很多基因的reads数很多,甚至上千,但是有很多基因却是个位数甚至0,那这种数据离散程度也是很大的,但是我们会发现当我们对1000取以10为底的对数时,就变成了3,对10取以10为底的对数时,就变成了1,这样就实现了降低数据离散程度的目的。#加载文件load(file="/kriegsteinlab/data1/aparna/homefiles/cleanedobjects_bysample_June2019/neocortex.RData")#colSum()用于计算矩阵或数组列的综合。

2023-10-16 18:45:01 108 1

原创 看PCA图

样本间有交叉:像垂直xy的z州,三维空间不重叠。分分合合:不同类型样本分开,相同类型样本聚集。许多变量——变量之间有相关关系。转换后这组变量叫主成分。——新生成综合性变量。

2023-10-15 22:02:13 126 1

原创 【无标题】

可以先找一下,命令为conda search fastqc。cut:文本切割,常见参数:-d 指定分隔符。conda env list列出已存在的小环境。#创建名为rnaseq的conda小环境。base环境里最好不要装任何包。删除已创建的小环境及安装的包。不同的软件的以来会相互冲突。启动rnaseq小环境。启动环境——安装软件。

2023-09-13 16:31:13 39 1

原创 shell基础

3.Shell是Linux内置脚本(开发运维、批处理、语法简单,代码写起来轻松,简单易学)2.脚本:一条条文字命令(可见,比如用记事本打开查看编辑)1.shell是一个程序,操作linux的桥梁。既是一种命令语言,又是一种程序设计语言。Javascript是最常见的前端脚本。JSP,PHP(外部开发最常,后端)SQL 标准查询语言,操作数据库的。4.Linux默认的shell是。read -p 提示信息 变量名。Lua 游戏用的比较多。转换它的意思称之为转义。

2023-09-12 14:21:06 35

原创 转录组基本原理与方案设计

给两个样本乘以不同的系数,让大多数相等,这时候还有提高的。问题:人知道谁是内参基因,但是动植物不知道谁是内参基因。解决办法2 :假设大多基因是没有差异表达的(TMM)如何分配多处比对的reads:概率分配(机器学习)3.样本聚类分析:探索样本之间的关系,锁定关键样本。RPKM做法是错的,但是趋势相同,结论是正确的。通过ClusterProfilter软件包来做。5.聚类分析和WGCNA:探索基因与表型的关系。基因见相关系数:找到与已知基因关联的基因。一些特殊情况:全是差异表达基因怎么办?

2023-09-11 21:59:43 304

原创 vi\vim编辑器

vim是vi的加强版本,兼容vi所有指令,还能用shell程序编辑的功能,可以用不同的颜色进行文本编辑/如果文件路径表示文件存在,那么此命令用于编辑已有文件。visual interface 文本编辑器。如果文件不存在,此命令用于编辑新文件。vi\vim编辑器的三种工作模式。

2023-09-10 20:32:27 39 1

原创 echo命令

echo "我当前工作目录为:`pwd`" > work.txt。输出内容比较复杂,用双引号包起来,“”不显示在之后打印的信息。tail test.txt 默认产看尾部十行内容。自动的追加到原来的,显示了最新的更改(程序持续。tail [-f -num] Linux路径。2.反引号` 包围内容以命令执行。-f 持续追踪follow的意思。ctrl c 强制停止命令的运行。1.echo 输出命令。有点像print语句。

2023-09-10 19:45:04 64 1

原创 linux命令学习day2

6.which 查看所使用的一系列命令的程序文件(本质是程序,即windows中的.exe)存放在哪里。颜色不一样(文件夹是深色),ls -l列出后标识为d是文件夹,前面是-是文件。find 起始路径 -size +l-n[KMG]more支持翻页,文件内容过多,可以一页一页展示。rm [-r -f] 参数1 参数2 ……路径必填,-p自动创建不存在的父目录,连续多层。wc [-c -m -l -w] 文件路径。*test* 匹配任何包含test的内容。9.grep [-n] 关键字 文件路径。

2023-09-10 11:27:26 65 1

原创 Linux命令入门

当前登录用户的HOME目录为当前工作目录,个人账户目录(我的房子),路径在:/home/用户名。-a :all的意思,列出全部文件(包含隐藏的文件(前面有一个点)。命令:linux程序,没有图形化页面,可以在命令行(终端中)提供字符化反馈。直接用ls以平铺的形式显示当前目录(默认用户的HOME目录)下的文件(夹)黑马程序员视频的好处:对照图形化(VM中有,就是VM有桌面)ls [ -a -l -h] [linux路径]-l : 以列表(竖向排列)的形式显示内容。以列表的形式显示 路径目录内的内容。

2023-09-09 11:45:29 47 1

原创 远程登录linux+Linux目录系统

通过FinalShell去操作LINUX。只有一个根目录 / ,所有文件都在它下面。3.Linux路径之间的层级关系,用:/2.Linux目录树形结构,只有一个树。ps:windows可以有多个顶级目录。

2023-09-09 11:11:03 40 1

原创 压缩和解压

将123打包到test.tar中,体积没有减少,可以用 ls -l命令查看。将123打包压缩到txt.tar.gz文件中,体积减少。注意:-z有的话一定要在选项第一位,文件后缀跟.gz。-f必须在选项最后,以用来写压缩到哪个文件里。-d用来指定要解压去的位置,同tar中的-C。unzip [-d] 参数。2.解压_也是tar命令。参数中有文件夹要用-r。

2023-09-09 10:41:06 71 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除