- 博客(17)
- 收藏
- 关注
原创 SAW处理Stereo-seq的流程整理
替换为你的样本名称(如 Rice_Endosperm_01)# 替换为你的数据根目录(所有输入文件存放路径)# 替换为参考基因组目录(genome.fa + genes.gtf 所在路径)# 替换为芯片 mask.h5 文件路径(STOmics 官方提供对应芯片型号的 mask)# 替换为 ssDNA 图像压缩包路径# 输出目录(自动创建,避免文件混乱)# 输出目录(仅保留核心环节)stitch.tif和的关系,就像同一栋房子的 “地图坐标” 和 “现实地址”
2025-12-10 22:26:56
961
原创 CUT and Tag 数据分析与整理
将clean data同时比对至E coli参考基因组上,可以进行后续spike in calibration。但是我们测试发现不去接头比对率非常低,所以此处用fastp去接头。比对时设置参数--local, 局部比对。5. 生成bw文件 用于IGV可视化。官网建议不需要进行数据去接头。
2025-03-04 15:13:01
1371
原创 DESeq2转录组分析 火山图绘制 GO dotplot绘制
读取转录组Count矩阵,注意DESeq2只接受原始的reads数,不能输入TPM及FPKM等标准化的表达量矩阵,且差异分析效果而言,Count矩阵是最好的。基于网站进行GO和KEGG富集,随后利用R的ggplot进行画图。使用R包 clusterProfiler进行富集分析。获取Normalized的基因表达量矩阵。PCA图绘制,可以自行modify。不同样本间相关性分析。
2024-12-26 20:00:50
373
原创 在Windows和Linux系统下分别为命令行设置永久别名
计算机\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\,最上方输入这个路径进入Microsoft文件夹,查看是否有Command Processor文件夹,若没有,则新建一个,并命名为Command Processor。随后新建一个alias.bat文件,位置最好在C盘,笔者例:C:\Users\admin\alias.bat,文件中写入以下内容。找到命令提示符的快捷方式,随后修改快捷键为Ctrl+Alt+Z,这里可以根据个人习惯自行调整。
2024-12-10 14:54:23
608
原创 单细胞scCustomize安装
随后报错r-cairo依赖未安装,使用install.packages安装失败,尝试conda安装。提示Matrix依赖未安装,Seurat v5版本安装时曾安装过Matrix,命令如下。
2024-12-06 20:20:25
551
原创 华大空间转录组Stereo-seq数据转化为seurat对象
使用R包SeuratDisk 将h5ad文件批量转化为Seurat函数能识别的h5seurat文件。基于python的stereopy库将gem文件批量转化为h5ad(seurat可识别)文件。
2024-11-26 10:43:59
1260
原创 Seurat V5安装
软连接到/usr/local/bin 我理解这部分内容比较类似于将hdf5中的内容添加到系统环境变量中,因此R能识别到hdf5相关编译器,与这部分下列注释的代码可能有异曲同工之妙。这表明加载包的时候不能识别 hdf5 的动态库,实际包已经安装好了,只是不能加载 hdf5 动态库,需要手动配置 hdf5 动态库 libhdf5_hl.so.310。虽说能解决hdf5r的安装问题,但是BPCells仍然安装不上,因此用conda安装hdf5,然后安装BPCells成功。官网推荐安装以下四个包,作用详见注释。
2024-11-20 18:34:10
2249
原创 物种内共线性分析流程-以玉米、水稻、拟南芥、大豆为例
在“ControlDialog”面板中,单击“Add”以获得附加轨道,拖放基因密度信息文件(“GeneDensity.profile”),选择热图模式,然后刷新绘图。如果基因密度分布明显有偏差,可以在左下角面板的“HeatColorScale”菜单中尝试不同的颜色缩放模式,以获得更好的视图。若多物种间共线性分析-同时考虑种内和种间,则把所有物种的蛋白组文件合并为一个新的fa文件,当做种内共线性处理,见上一个脚本。借助PLATZ家族成员的共线性关系以及过滤后的gff文件获得link-location关系。
2024-11-16 19:21:48
2131
原创 RNA-seq分析流程 以水稻胚乳为例
至此转录组上游分析完成,但是有可能存在PCR重复过高的问题,考虑可以去除PCR重复。:数据量约10G时,Duplication rate在10%左右;:数据量约90G时,Duplication rate在10%左右;:Duplication rate在40% ~ 50%左右;什么是二代测序中的duplication问题。
2024-11-15 14:34:15
378
1
原创 单细胞双胞过滤-scrublet安装
pip install scrublet ----use-pep517有如下报错,分析可知安装annoy时不会自动更新gcc的版本,centos默认是4.8.5。pip install scrublet ----use-pep517 仍然报错,但似乎不影响使用,提示Successfully installed。打开终端,进入Python环境,输入以下代码,查看Python安装位置。暂时还没尝试是否存在问题,如果存在问题,降级scrublet版本。包的开发依赖的是比较低版本的numpy,会用到。
2024-11-15 11:51:15
657
原创 HiC-Pro安装
可以发现在此环境中配置了python=3.8.10 scipy numpy iced bx-python pysam cooler。如果是手动下载依赖环境,则需要指定依赖环境的路径,配置config-install.txt。将下载好的.sra数据用fastq-dump转换成fastq或fastq.gz保存在。但是逐个去安装依赖环境非常复杂,因此官网提供了yml文件,便于配置环境。根据HiC-pro Github官网指南,我们可以知道需要以下依赖。使用which命令查找路径。
2023-09-18 16:11:55
494
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅