
R
hyena_7
这个作者很懒,什么都没留下…
展开
-
下载R包后如何安装R包
packageurl原创 2023-06-23 20:07:55 · 253 阅读 · 0 评论 -
R语言:利用rhdf5包创建多组学.h5文件补充
R语言:将两种及两种以上组学数据转.h5文件转换方式。原创 2023-03-28 14:26:43 · 475 阅读 · 0 评论 -
R语言:读取loom文件,以及loom文件转成Seurat对象
使用satijalab开发的loomR读取loom文件,具体详见https://satijalab.org/loomr/loomr_tutorial。原创 2022-09-05 20:06:33 · 4206 阅读 · 1 评论 -
R语言:多个向量合并
【代码】R语言:多个向量合并。原创 2022-09-02 14:26:50 · 6394 阅读 · 0 评论 -
R语言:利用rhdf5包分别创建单组学,多组学.h5文件
创建好的.h5文件结构如下,和10X提供的.h5文件结构是一样的。原创 2022-09-02 10:04:09 · 1286 阅读 · 0 评论 -
Error in py_run_file_impl(file, local, convert) : ModuleNotFoundError: No module named ‘igraph‘
此时我已经知道了我应该往哪个虚拟环境里面安装igraph包,就是 /public/home/hpc/.local/share/r-miniconda/envs/r-reticulate/py_module_available(“igraph”)#返回了False。use_condaenv(“r-reticulate”)#指定虚拟环境。即可,继续提交我的R任务,成功出结果!...原创 2022-08-29 11:25:01 · 1996 阅读 · 3 评论 -
Linux:如何命令行安装R包
packageurl #R包存放的路径。原创 2022-08-23 13:59:04 · 604 阅读 · 0 评论 -
R语言:Read10X()函数读取小数据集异常缓慢的问题
今天解决了个大问题!这样处理之后,一切问题迎刃而解,啥毛病都没有了,正常读取,非常快速!根据这段代码,我锁定了有问题的文件:genes.tsv。我灵机一动,那就换一种读法!原创 2022-08-12 21:09:45 · 2333 阅读 · 0 评论 -
R语言按照指定的顺序对dataframe进行排序
代码】R语言按照指定的顺序对dataframe进行排序。原创 2022-08-09 22:25:45 · 4423 阅读 · 0 评论 -
Cell Hashing简述
CellHashing和CITE-seq的测序原理基本一样,只是换了一个应用场景。它解决的问题是如何将不同样本的细胞混起来测序(便宜),测完了还能区分哪个细胞来源于哪个样本,这样做也减少了批次效应。...原创 2022-07-26 20:03:06 · 582 阅读 · 0 评论 -
随笔-对单细胞scRNA-seq进行质控
人类参考基因中线粒体基因是以“MT-”开头的,而在小鼠中是以“mt-”开头的原创 2022-07-10 14:13:37 · 836 阅读 · 0 评论 -
记录安装适配Monocle3的Cicero的血泪全过程
目标:想使用cicero计算一下gene activity scores,根据cicero文档https://cole-trapnell-lab.github.io/cicero-release/docs/用这两句命令,安装cicero成功安装,然后按照教程跑pipeline,注意此时安装的cicero支持的是Monocle2版本运行到降维这步的时候,开始报错:后来知道是Monocle2的问题,我的数据集细胞数7万以上,Monocle2跑不了这么大的数据集,我决定安装适配Monocle3版本的ci原创 2022-07-06 20:51:41 · 1837 阅读 · 0 评论 -
scRNA-seq的fastq文件处理流程——持续更新
获得了一批新的scRNA-seq的fastq.gz文件,每个样本的数据形式为:我打算使用10X cellranger处理fastq.gz文件,下载及安装方式在官网:https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/2.0这个网址写了10X cellranger处理fastq.gz文件的命名规则https://support.10xgenomics.com/single-cell-gene-expr原创 2022-06-29 10:24:01 · 2838 阅读 · 0 评论 -
单细胞聚类方法SC3疯狂报错——Error in [.default(clusts, , paste0(“sc3_“, hash.table[i, 1], “_clusters“))
SC3 - consensus clustering of single-cell RNA-Seq data这是scRNA-seq聚类方法里面比较经典的聚类方法,在跑数据集的时候,几个一千多个细胞的小数据集没有报错,但是运行一个5000+细胞以上的数据集时,在这步:疯狂报错!!!就很无语,难道这种经典方法我都跑不通嘛!到了推理原因的时刻了First,小数据集上我能跑通,所以问题不是在这个方法上,应该是因为数据集大小的改变,哪些参数不合适了,我去看了SC3的手册:https://bioconducto原创 2022-06-18 13:52:35 · 638 阅读 · 0 评论 -
服务器ubuntu 18.04更新RStudio Server(r 4.2.0 rstudio server 2022.02.2+485 )
因为Ubuntu中自动把r升级到了 4.2.0版本,RStudio中的一些包在使用的时候会报错,比如跑cisTopic的时候:为了解决这个问题,要将Rstudio Server一起升级,解决方案如下:使用管理员账号安装的教程看:https://blog.youkuaiyun.com/watermel__/article/details/120724232?ops_request_misc=%257B%2522request%255Fid%2522%253A%252216554425671678218468187原创 2022-06-17 13:09:50 · 1714 阅读 · 0 评论 -
聚类教程:cisTopic——来自单细胞表观基因组学数据的顺式调控主题的概率建模
之前运行这步的时候报错了如下:后来发现原因是Ubuntu自动把R包更新到4.2版本,但是Rstudio版本没有更新,更新Rstudio即可,更新Rstudio的教程看此教程:。原创 2022-06-17 13:00:22 · 863 阅读 · 0 评论 -
在Ubuntu虚拟环境里安装低版本的R
因为一个R包的需要,R环境必须小于3.5,就新建个虚拟环境:看看有哪些版本的R可以下载:选择r 3.4.3安装:很完美,R从4.2降到了3.4原创 2022-06-16 14:12:33 · 619 阅读 · 2 评论 -
R语言:如何存储超大数据集
有的时候数据会以.RDS的格式被提供,这个时候就只能用R语言读取文件。如果遇到超大数据怎么把数据存储出来呢?可以发现这个数据特征数非常多,我要获取归一化以后的data矩阵。代码如下:save_npz_.py文件里面的内容:...原创 2022-06-09 16:59:46 · 1061 阅读 · 0 评论 -
R语言 ggplot2 violin plot : Quick start guide - R software and data visualization
http://www.sthda.com/english/wiki/ggplot2-violin-plot-quick-start-guide-r-software-and-data-visualizationps:ggplot作图介绍https://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/ggplot2.html原创 2022-05-19 13:59:01 · 160 阅读 · 0 评论 -
R语言 foreach并行执行求两两基因之间的功能相似度
file里面是基因以及对应的功能,要计算两两基因间的功能相似度,普通for循环太慢了,故用foreach并行操作:library(GOSemSim)library(data.table)library(org.Mm.eg.db)library(foreach)library(doParallel)getDoParWorkers( ) #查看注册了多少个核,配合doMC package中的registerDoMC( )使用getDoParRegistered( ) # 查看doPar是否原创 2022-05-07 13:57:31 · 905 阅读 · 0 评论 -
Ubuntu 18.04.6安装OpenBLAS加速R语言矩阵运算
我是直接获取管理员权限,在Ubuntu中使用apt-get命令安装:sudo apt-get install libopenblas-dev安装成功以后,重启RStudio(kill -9 PID)即可。确实加速了很多PS:还有个GPU加速的cuBLAS库,以后可以试试。原创 2022-04-02 11:45:18 · 1642 阅读 · 0 评论 -
R语言:按照矩阵的行,随机打乱矩阵顺序
随机输入矩阵:cell_name <- colnames(mix_rna)cell_name_new <- sample(cell_name)ord <- as.vector(cell_name_new) indx <- factor(colnames(mix_rna), levels = ord) mix_rna<-mix_rna[,order(indx)]mix_atac<-mix_atac[,order(indx)]原创 2022-03-22 20:11:48 · 2266 阅读 · 0 评论 -
MOFA+:run_mofa(mofa)失败的解决方法
今天用MOFA方法多组学聚类,在mofa <- run_mofa(mofa)这步疯狂报以下错误:Connecting to the mofapy2 python package using reticulate (use_basilisk = FALSE)…Please make sure to manually specify the right python binary when loading R with reticulate::use_python(…, force=TRUE)原创 2022-03-09 21:45:47 · 1045 阅读 · 1 评论 -
Error in value[[3L]](cond) : Package ‘rhdf5‘ version 2.36.0 cannot be unloaded:
library(rhdf5)Error in value[[3L]](cond) : Package 'rhdf5' version 2.36.0 cannot be unloaded:Error in unloadNamespace(package) : namespace 'rhdf5' is imported by 'HDF5Array', 'MOFA2' so cannot be unloaded这是从两个地方导入包导致的解决方法:unloadNamespace('MOFA2')unlo原创 2022-02-23 22:28:16 · 2895 阅读 · 0 评论 -
Python R分别读取.h5ad文件
1.Python读取.h5ad文件(比R方便)在这里插入代码片import anndataimport pandas as pdadata=anndata.read("/home/R/R_data/Seurat/PBMC10/output/adata.h5ad")adata.X.todense()X=pd.DataFrame(adata.X.todense())cell_name=adata.obs.indexchr_name=adata.var.indexX.index=cell_name原创 2022-02-22 13:27:02 · 10806 阅读 · 7 评论 -
R read.table() 行名和列名变成了第一行和第一列怎么办
列名很好设置:header=1即可设置列名mix_atac <-read.table('output/SCALE_ATAC.tsv',sep='\t',header = 1)行名设置:先保存第一列,再删掉第一列,然后将保存的行名赋给dataframe的行名mix_atac_row <- mix_atac$Xmix_atac <- mix_atac[,-1]rownames(mix_atac) <- mix_atac_row...原创 2022-02-22 13:18:31 · 6382 阅读 · 0 评论 -
怎么同时在同一台电脑上使用两台及以上个服务器上的Rstudio
这个问题真的困扰我许久!今日终于解决!其实非常简单!假如两个服务器上的隧道都是8787映射到8787那登录的网址分别是:http://localhost:8787/http://服务器IP:8787/原创 2022-02-21 22:28:45 · 2671 阅读 · 0 评论 -
R语言 记录程序运行时间
start<-Sys.time()end<-Sys.time()运行的程序 runningtime<-end-startcat(runningtime)原创 2022-02-12 15:44:48 · 3926 阅读 · 0 评论 -
R语言的去重和字典
去重:library(dplyr)ok <- ok %>% distinct(geneexp.entrez_id ,.keep_all =TRUE)#geneexp.entrez_id为ok(dataframe)中要去重的列 ok字典:#利用list建立字典list_data <- list()for (i in 1:length(m2h.g$NCBI.gene..formerly.Entrezgene..ID.1)){ list_data[[i]]<-m2h原创 2021-11-20 17:38:04 · 2379 阅读 · 0 评论 -
BiomaRt 将小鼠的ENTREZID转化为人类的ENTREZID(同源ENTREZID转换)
geneexp.entrez_id = mapIds(x = org.Mm.eg.db, keys = geneLookup, keytype = "ENSEMBLTRANS", column = "ENTREZID")#先将小鼠的转录本ID转为小鼠的ENTREZIDlibrary(annotationTools)library(biomaR原创 2021-11-20 17:29:24 · 2943 阅读 · 0 评论 -
服务器RStudio:ImportError: /usr/lib/x86_64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.26‘ not found
RStudio:想在RStudio中调用python文件library(reticulate)source_python("metrics.py")报错:Error in py_run_file_impl(file, local, convert) : ImportError: /usr/lib/x86_64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.26' not found (required by /home/***/miniconda原创 2021-10-13 11:39:15 · 1110 阅读 · 0 评论 -
服务器ubuntu 18.04安装RStudio Server(安装最新版r-base 4.1.1)
1 获得管理员权限2 在自己的用户目录下安装RStudio Server\home\user-name3 查看当前r-base的可安装版本,发现没有想要的最新版本的r-baseapt-cache madison r-baser-base | 3.4.4-1ubuntu1 | http://cn.archive.ubuntu.com/ubuntu bionic/universe amd64 Packagesr-base | 3.4.4-1ubuntu1 | http://cn.archive原创 2021-10-12 15:31:19 · 1914 阅读 · 0 评论 -
Linux:又是安装R包安到想死的一天‘stringi‘ ‘curl‘
用了各种方法解决不了,最后conda安装成功conda install -c r r-stringi原创 2021-10-09 15:38:34 · 4577 阅读 · 4 评论 -
R语言 向dataframe中循环存值大无语事件
问题:存值失败,代码如下for (i in (1:11)){ cat('i :',i,'\n') CO=unlist(strsplit(cluster[i,],split = '\t')) H=length(CO) for (j in (1:H)) cat('nrow(df) :',nrow(df),'\n') df[nrow(df)+1,] <- c(CO[j],i)} 存值结果明显不是我想要的:问题原因:for循环内的内容要用{ }括原创 2021-09-08 09:47:01 · 416 阅读 · 0 评论 -
Seurat学习:如何将自定义的聚类标签添加到Seurat对象当中
假如要添加k-means聚类标签:object@meta.data$k.means.clusters <- k.means.result绘制自定义标签的UMAP图:DimPlot(object , reduction=‘umap’,group.by = “k.means.clusters”)同时显示自定义标签和UMAP图和Seurat中louvain聚类的UMAP图plot3<-DimPlot(object, reduction = “umap”,group.by = ‘ident’)原创 2021-08-24 13:22:36 · 6626 阅读 · 0 评论 -
non-zero exit status
1.windows安装R包出现non-zero exit status问题2.只能单独安装这个non-zero exit status的R包要是install.packages(‘包名’)不好使,就去找.zip形式的包RStudio安装.zip包的方式:原创 2021-07-29 10:07:56 · 1117 阅读 · 0 评论 -
Installation failed: Failed to connect to raw.githubusercontent.com port 443: Connection refused
哭死!想要安装cisTopic (https://github.com/aertslab/cisTopic/blob/master/README.md),一直出现Installation failed: Failed to connect to raw.githubusercontent.com port 443: Connection refused错误,查了好多教程,总结如下:1.https://www.ipaddress.com/进入此网站,输入要访问的域名:得到IP地址,任选一个添加到服务器的原创 2021-07-27 22:42:22 · 629 阅读 · 0 评论 -
服务器上配置R环境,下载R包
1.新建一个虚拟环境conda create -n R_env python=3.72.下载r-baseconda install r-base=4.0.53.用conda下载需要的R包去这个网站https://anaconda.org/,搜索想要下载的R包例如:搜索Seurat在当前虚拟环境下conda install 即可4.进入R环境R5.查看已安装的包installed.packages()6.加载包library(包名)...原创 2021-07-26 22:30:38 · 2456 阅读 · 0 评论 -
R语言修改下载安装包install.package的默认存储位置
https://blog.youkuaiyun.com/sinat_35187039/article/details/80239668原创 2021-03-28 10:20:37 · 2598 阅读 · 0 评论 -
R语言利用peason相关性获取基因和细胞关系矩阵中细胞间的关系(相关系数矩阵)
1.利用安装在服务器上jupyter notebook中的R核来执行R代码,要是已经配置好了jupyter notebook一直找不到R核,那就在jupyter notebook安装的环境中进入R环境再次进行配置,详见之前的教程:https://editor.youkuaiyun.com/md/?articleId=115184963 2.导入要使用的基因和细胞关系矩阵,我这里使用的是.csv文件,所以使用read.csv()函数进行读取。 3.因为R中的Peason相关性是针对列与列之间的关系,所以选取需要原创 2021-03-25 17:05:01 · 2003 阅读 · 0 评论