劳工小朋友-优快云博客

原创解决【R】Error in Ops.data.frame(guide_loc, panel_loc)，‘==‘ only defined for equally-sized data frame

patchwork的版本问题。ggplot2的版本问题。Matrix的版本问题。

2025-05-13 20:57:22 465

原创 Harmony的bug ： no applicable method for ‘Key‘ applied to an object of class “character“

如何解决呢？

2025-03-11 15:58:31 485

原创主动学习的类型

MQS适用于需要生成新样本的场景，stream-based适用于数据流连续且需要即时反馈的场景，而pool-based适用于可以批量处理数据的场景。定义：在MQS场景中，主动学习算法可以从整个无标签数据集中选择任意样本，包括算法自己生成的数据，然后请求一个“oracle”（通常是领域专家或标注工具）来提供这些样本的标签。应用：MQS可以用于那些需要算法生成新样本并请求标注的场景，比如在模拟环境中训练机器人时，算法可能会生成一系列动作，然后需要专家来评估这些动作的效果。

2024-11-23 17:15:49 504

原创为什么神经网络的可解释性差？

确实，神经网络中的权重和偏置是影响可解释性的因素之一，但还有其他几个关键因素也对神经网络的可解释性产生了影响。这些函数的引入使得网络能够学习和模拟复杂的函数映射，但同时也使得网络的行为更加难以预测和解释。每一层都在提取和转换信息，形成更抽象的表示。网络的决策过程不是基于易于理解的规则或路径，而是基于权重和激活函数的复杂组合。权重和偏置的值通常是高维空间中的点积和加法运算的结果，这些操作的直观意义对于人类来说并不明显。总的来说，神经网络的可解释性是一个活跃的研究领域，涉及到理解网络内部工作机制的多个方面。

2024-11-21 18:55:32 1222

原创特殊变量和函数变量的区别

在编程和计算机科学中，“special variables”（特殊变量）和"function variables"（函数变量）是两种不同类型的变量，它们在用途和行为上有所区别。函数变量是在函数或代码块的上下文中定义的变量。用途：特殊变量用于执行特定的、通常与语言或环境相关联的任务，而函数变量用于存储函数执行过程中的临时数据。全局变量：虽然不是函数变量，但全局变量是在函数外部定义的，可以被函数内部访问和修改的变量。作用域：特殊变量通常具有全局作用域，而函数变量的作用域限于它们被定义的函数或代码块。

2024-11-20 17:16:56 524

原创 Linux系统中GPU使用

查看当前GPU程序占用的用户。

2024-08-24 16:10:57 187

原创加速conda安装程序包——mamba

通过以下方式安装，比conda install mamba -n base -c conda-forge速度快很多。如激活环境 conda activate 换成 mamba activate。mamba安装环境速度远大于conda和miniconda。

2024-08-19 12:00:38 609

原创 scVi成功配置环境分享

【代码】scVi成功配置环境分享。

2024-08-17 14:26:30 297

原创 pytorch安装版本对应问题

参考pytorch, cudatoolkit之间的版本对应关系。

2024-08-17 12:18:13 727

原创 _torchtext.so: undefined symbol: _ZTVN5torch3jit6MethodE AND KeyError: ‘SP_DIR

import torchtext的时候出现_torchtext.so: undefined symbol:。不要使用pip3安装，否则安装 torchtext 0.15.2会同步更新torch 2.1.1, 使用。在linux环境中定义SP_DLR的路径，路径是安装torch的路径。torch 2.0.1 对应 torchtext 0.15.2。运行python,导入torchtext包，问题解决。torch 与 torchtext版本不对应。验证成功的版本对应“

2024-08-16 16:09:32 770 2

原创 Could not get the file at http://www.quest.dcs.shef.ac.uk/wmt16_files_mmt/training.tar.gz. [RequestE

并将三个文件放在/root/.cache/torch/text/datasets/Multi30k（本目录根据个人有所变化）压缩文件可从以下链接下载：https://share.weiyun.com/wvtbBVWS。

2023-12-06 11:35:36 766

原创 R语言构建深度学习的框架：reticulate

进入/home/u19111010045/.local/share/r-miniconda/envs/r-reticulate的r-reticulate环境中，安装cudatoolkit==10.1.243。进入/home/u19111010045/.local/share/r-miniconda/envs/r-reticulate的r-reticulate环境中，安装tensorflow。同时将LD_LIBRARY_PATH的路径上增加libcudart.so.10.1所在库。

2023-07-05 19:11:51 910

原创 AttributeError: partially initialized module xxx has no attribute ‘XXX‘

解决方案：查看sys.path中是否包含了重复的路径，如果包括了，去掉重复的路径，重新加载module XXX即可。

2023-06-21 11:37:19 7213

原创 R语言删除在多组数据中重复的数据

#删除在多组数据中重复的数据set1 <- c("1","2","7","9","12","13","15","17","19","23")set2 <- c("2","4","7","13","9","12","28","11")set3 <- c("3","9","19","20")bind_set <- c(set1,set2,set3)bind_setduplicate_set <- bind_set[duplicated(bind_set)] #筛选数据里

2021-09-12 16:30:13 1836

原创 Error in .jcall(“RJavaTools“, “Ljava/lang/Object；“, “invokeMethod“, cl, : java.lang.OutOfMemoryE

目前存在的问题：代码运行中Error in .jcall(“RJavaTools”, “Ljava/lang/Object;”, “invokeMethod”, cl, :java.lang.OutOfMemoryError: Java heap space参考解决办法https://blog.youkuaiyun.com/u012110870/article/details/104339396使用openxlsx这个R包...

2021-09-01 23:45:38 1313

原创 monocle的算法

参考内容https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-019-2599-6monocles分析差异基因利用了一个广义加和模型：generalized addictive model (depending on smoothing functions)。Y：the gene expression levelXi：the predictor variable that expresses the cell c

2021-09-01 23:44:41 419

原创细胞类型注释

细胞类型注释：根据细胞的特征基因（marker基因）进行注释，一般情况是预先并不知道该特征基因对应的细胞类型，所以需要通过用细胞的特征基因对细胞类型进行注释，判断。注释的方法：2. 自动注释：SingleR, Cellassign, Celaref, Garnett, scTPA, Cell Blast, scCATCH.SingleR注释：main大类注释fine小类注释手动注释：经典的细胞marker, 来自于文献整理。...

2021-08-10 10:00:12 8352

原创 R进行批量文件的重命名

allfile <- list.files()for (f in allfile) { newname <- sub(".csv",".xlsx",f) #for循环内的每行是运行命令行，不是参数，不能加“，” file.rename(f,newname) }dir()

2021-08-01 21:27:24 1410

原创 R绘制Venn图

维恩图：反映不同集合之间的交集以及并集情况的展示图常用R包：gplots，venneuler,VennDiagram

2021-08-01 21:21:23 1010

原创 apply函数

apply函数运用矩阵进行计算，一行或一列地运行用法：apply(array, margin, function)参数含义：array: 计算的数据margin: 按行或列计算function: 运行的函数运行代码：matrix <- matrix(c(1:10), nrow = 5, ncol = 6)rows <- apply(matrix, 1, sum) # 1 is rowcols <- apply(matrix,2,sum) # 2 is col运行结

2021-07-29 15:02:23 981

原创单细胞测序在非小细胞肺癌T细胞中的应用

单细胞测序获得非小细胞肺癌的T细胞特征图谱参考内容https://www.bilibili.com/video/BV1za4y1v7gF/?spm_id_from=trigger_reload对这篇文章一点感觉也没有，感觉就是一群细胞。从1.2万样本中获得细胞并进行单细胞测序。对T细胞样本进行分成16类，并且确定细胞类型，细胞的特征基因。首先研究的是CD8+T细胞的发育过程和由肿瘤影响的单细胞发育过程。患者预后和CD4+调节性T细胞的探索。并且研究CD8+的T细胞...

2021-07-28 21:38:19 425

原创 AlphaFold2

DeepMind的AlphaFold 2解读! 蛋白质折叠的AI突破!https://www.bilibili.com/video/BV1Bh411Z74n/?spm_id_from=trigger_reloadhttps://www.bilibili.com/video/BV1Bo4y197Yv?from=search&seid=13773497593136628881https://www.bilibili.com/video/BV1cT4y1M7jK?from=search&s

2021-07-27 14:00:49 981

原创 R 字符串分割

RGENES = "ABLIM1, ACTN1, AIF1, APBA2, APEX1, ARHGAP45, ARHGEF18, ATM, BACH2, BEX4, C1orf162, C1orf228, C6orf48, CA6, CAMK4, CCR7, CD248, CD55, CEP68, COQ8A, DGKA, EEF2, EIF3E, EIF3L, EPHX2, EXOSC8, FAM102A, FAM117B"Gene = strsplit(GENES,split = ",", perl

2021-07-23 13:24:41 766

原创单细胞测序的marker基因

参考内容single cell marker 基因数据库https://www.jianshu.com/p/9d7789cc6d97CellMarker：用来做细胞标记，很nicehttps://zhuanlan.zhihu.com/p/300613622数据库：cellMarkerhttp://bio-bigdata.hrbmu.edu.cn/CellMarker/search.jsp?species=Human&tissue=Blood&cellname=B%20

2021-07-23 13:19:41 4052

原创 R对文件夹下所有文件统一处理

设定工作目录: setwd()将文件夹下所有文件名输入给1个变量: list.files()构建获取文件的路径: paste函数读取文件个数，以确定循环次数: length()依次读取文件: for循环循环操作输出文件library(rtracklayer)gtf = import("E:\\lab\\gencode.v29.annotation.gtf")gtf = as.data.frame(gtf)colnames(gtf)head(gtf)gtf_gene <- g.

2021-07-23 00:05:13 2580

原创 GEO数据库数据下载

GEO（Gene Expression Ommius datasets）:该数据库搜集了大量表达谱，甲基化，lncRNA，miRNA，CNV等芯片数据该数据信息包括了：GPL:GEO Platform 数据平台GSM: GEO Sample 样本的IDGSE: GEO Series 研究IDGDS: GEO Datasets 数据集的ID该数据类型包括了：SOFT：包括了探针与基因对应关系的注释文件，样本单独表达量，所有信息文件。MINIML : XML格式的所有数据Series

2021-07-21 17:21:54 2053

原创安装miniconda 及生物学软件

安装miniconda参考内容https://www.bilibili.com/video/BV1MV41117SD?from=search&seid=14095988536494616638下载安装miniconda的bash脚本mimiconda有不同平台的，由于我使用的是linux,因此采用linux版本的miniconda: Miniconda3-latest-Linux-x86_64.sh下载成功后，直接运行安装的脚本。设置miniconda安装目录安装成功后，激活co

2021-07-21 15:28:38 601

原创 Rtudio，plot不出图

Rtudio，plot不出图法1dev.off()dev.new()如果不行，重启RSTUDIO，再不行，就重启电脑吧。重启是解决人生烦恼的必备良药法2我捉摸着你的问题答案就在Pane Layout里面，把下拉框没显示的选择项打开，Plots打勾法3在画图之前先执行：dev.off() 就好了法4请更新至最新的R版本结果，全部无用...

2021-07-09 11:26:14 6736

原创 R包 splatter

splatter包如何下载？splatter包是模拟单细胞测测序数据的R包，可以从Bioconductor官网上下载。如何寻找帮助理解运行splatter包？了解splatter包的帮助信息可在R上通过以下方式寻求帮助。library(help = "splatter")该方式会在R的control界面上显示帮助信息。其次在安装包的安装位置找到doc文件夹，里面有小品文，可获得相关帮助信息：R-script, html, pdf。在Bioconductor官网上，对于每一个R包，也有R

2021-07-09 11:15:05 789

原创 PCA降维

PCA主成分分析：principle component analysis参考内容：什么是主成分分析PCA：https://www.bilibili.com/video/BV1E5411E71z/主成分分析是为了给数据降维，减少数据的存储内存。例如：位于平面坐标系的二维数据信息降低到一维平面。该图表明示例降维的情况PCA就是要找到这么一个坐标系，从而降低数据的维度。PCA中有两个内容：主成分1和主成分2主成分1：在坐标系该位置降维的信息量很大，各个数据点投影到该位置方差最大。主成分2：

2021-07-09 10:21:28 181

原创 scRNA-seq Course 学习

昨天和今天都在学习scRNA-seq测序的教程。scRNA-seq是对单个细胞进行测序分析，便于研究细胞的异质性。scRNA-seq和bulk-RNA-seq相似，区别只在于研究的细胞数量，后者是对同一组织的大量细胞进行转录组的分析，而前者是对单个细胞进行转录组分析。scRNA-seq的流程是制备单细胞，单细胞水平测序，数据分析。昨天看到了分离单细胞和测序平台的方法上。在分离单细胞方法有mirco-well plate、micro-fluid seq, droplet seq，分别是让细胞在微板上

2021-07-07 15:04:56 7318

空空如也

空空如也