生物信息学
文章平均质量分 63
居敬行简
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
SCINA(Semi-supervised Category Identification and Assignment)算法
正态化和对数转换后的表达矩阵EijE_{i,j}Eij,其中ii1..Ii(i=1..I)ii1..I为基因代号;jj1..Jj(j=1..J)jj1..J为细胞代号待分配的细胞类型代号r1..Rr=1..Rr1..R,每一个细胞均有且只有一个细胞类型对应每个细胞类型的基因特征SrS_rSr,基因特征之间不鼓励重叠每个细胞对应的真实细胞类型命名为zj01Rzj01...R,后文为了简略可以用sss。原创 2025-01-03 11:50:27 · 765 阅读 · 0 评论 -
传统转录组测序数据上游处理
输出结果为txt文件,每一行代表一个基因的信息,包括基因ID、染色体位置、起始和结束位置、链的方向(正链或负链)、基因长度以及一个与测序数据相关的值。例如,示例中第一行数据表示一个基因(ENSMUSG00000102693.2)位于染色体1上,从位置3143476到3144545,是一个正链基因,长度为1070。,效果非常棒,我按github上方法安装的binary文件,有点小麻烦,其他两种手段没有试过,具体详见参考链接3。下载,需要下载的是fasta文件和gtf文件。samtools使用conda安装。原创 2024-09-21 15:35:31 · 1194 阅读 · 0 评论 -
linux(Ubuntu 24.04)安装R及Rstudio
按着链接做就没问题遇到的唯一一个错误提示解决办法参考不过执行完成后有个插曲这个不是报错,可以继续执行。原创 2024-09-21 12:15:41 · 1451 阅读 · 0 评论 -
Hisat2报错“libstdc++.so.6: version `GLIBCXX_3.4.26‘ not found”
使用conda升级对应环境中的libstdcxx包。此时使用hisat2 --help则正常输出。原创 2024-09-20 12:12:41 · 304 阅读 · 0 评论 -
关于sc.tl.leiden报错“ValueError: high is out of bounds for int32”
原因是因为我用的window64位平台和Linux平台的c语言long的取值范围不同,在win64位下是int32。下有一个作者提供了解决方案,可以参考他的commitment。承诺会着手修复这个问题,但是我等不了。原创 2024-05-05 14:46:15 · 1084 阅读 · 1 评论 -
单细胞上游分析
本文最后修改时间为2024/3/27。原创 2024-03-28 17:23:02 · 1615 阅读 · 0 评论
分享