- 博客(55)
- 收藏
- 关注
原创 Harmony的bug : no applicable method for ‘Key‘ applied to an object of class “character“
如何解决呢?
2025-03-11 15:58:31
188
原创 主动学习的类型
MQS适用于需要生成新样本的场景,stream-based适用于数据流连续且需要即时反馈的场景,而pool-based适用于可以批量处理数据的场景。定义:在MQS场景中,主动学习算法可以从整个无标签数据集中选择任意样本,包括算法自己生成的数据,然后请求一个“oracle”(通常是领域专家或标注工具)来提供这些样本的标签。应用:MQS可以用于那些需要算法生成新样本并请求标注的场景,比如在模拟环境中训练机器人时,算法可能会生成一系列动作,然后需要专家来评估这些动作的效果。
2024-11-23 17:15:49
419
原创 为什么神经网络的可解释性差?
确实,神经网络中的权重和偏置是影响可解释性的因素之一,但还有其他几个关键因素也对神经网络的可解释性产生了影响。这些函数的引入使得网络能够学习和模拟复杂的函数映射,但同时也使得网络的行为更加难以预测和解释。每一层都在提取和转换信息,形成更抽象的表示。网络的决策过程不是基于易于理解的规则或路径,而是基于权重和激活函数的复杂组合。权重和偏置的值通常是高维空间中的点积和加法运算的结果,这些操作的直观意义对于人类来说并不明显。总的来说,神经网络的可解释性是一个活跃的研究领域,涉及到理解网络内部工作机制的多个方面。
2024-11-21 18:55:32
908
原创 特殊变量和函数变量的区别
在编程和计算机科学中,“special variables”(特殊变量)和"function variables"(函数变量)是两种不同类型的变量,它们在用途和行为上有所区别。函数变量是在函数或代码块的上下文中定义的变量。用途:特殊变量用于执行特定的、通常与语言或环境相关联的任务,而函数变量用于存储函数执行过程中的临时数据。全局变量:虽然不是函数变量,但全局变量是在函数外部定义的,可以被函数内部访问和修改的变量。作用域:特殊变量通常具有全局作用域,而函数变量的作用域限于它们被定义的函数或代码块。
2024-11-20 17:16:56
295
原创 加速conda安装程序包——mamba
通过以下方式安装,比conda install mamba -n base -c conda-forge速度快很多。如激活环境 conda activate 换成 mamba activate。mamba安装环境速度远大于conda和miniconda。
2024-08-19 12:00:38
408
原创 _torchtext.so: undefined symbol: _ZTVN5torch3jit6MethodE AND KeyError: ‘SP_DIR
import torchtext的时候出现_torchtext.so: undefined symbol:。不要使用pip3安装,否则安装 torchtext 0.15.2会同步更新torch 2.1.1, 使用。在linux环境中定义SP_DLR的路径,路径是安装torch的路径。torch 2.0.1 对应 torchtext 0.15.2。运行python,导入torchtext包,问题解决。torch 与 torchtext版本不对应。验证成功的版本对应“
2024-08-16 16:09:32
577
2
原创 Could not get the file at http://www.quest.dcs.shef.ac.uk/wmt16_files_mmt/training.tar.gz. [RequestE
并将三个文件放在/root/.cache/torch/text/datasets/Multi30k(本目录根据个人有所变化)压缩文件可从以下链接下载:https://share.weiyun.com/wvtbBVWS。
2023-12-06 11:35:36
639
原创 R语言构建深度学习的框架:reticulate
进入/home/u19111010045/.local/share/r-miniconda/envs/r-reticulate的r-reticulate环境中,安装cudatoolkit==10.1.243。进入/home/u19111010045/.local/share/r-miniconda/envs/r-reticulate的r-reticulate环境中,安装tensorflow。同时将LD_LIBRARY_PATH的路径上增加libcudart.so.10.1所在库。
2023-07-05 19:11:51
837
原创 AttributeError: partially initialized module xxx has no attribute ‘XXX‘
解决方案:查看sys.path中是否包含了重复的路径,如果包括了,去掉重复的路径,重新加载module XXX即可。
2023-06-21 11:37:19
6630
原创 R语言 删除在多组数据中重复的数据
#删除在多组数据中重复的数据set1 <- c("1","2","7","9","12","13","15","17","19","23")set2 <- c("2","4","7","13","9","12","28","11")set3 <- c("3","9","19","20")bind_set <- c(set1,set2,set3)bind_setduplicate_set <- bind_set[duplicated(bind_set)] #筛选数据里
2021-09-12 16:30:13
1772
原创 Error in .jcall(“RJavaTools“, “Ljava/lang/Object;“, “invokeMethod“, cl, : java.lang.OutOfMemoryE
目前存在的问题:代码运行中Error in .jcall(“RJavaTools”, “Ljava/lang/Object;”, “invokeMethod”, cl, :java.lang.OutOfMemoryError: Java heap space参考解决办法https://blog.youkuaiyun.com/u012110870/article/details/104339396使用openxlsx这个R包...
2021-09-01 23:45:38
1274
原创 monocle的算法
参考内容https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-019-2599-6monocles分析差异基因利用了一个广义加和模型:generalized addictive model (depending on smoothing functions)。Y:the gene expression levelXi:the predictor variable that expresses the cell c
2021-09-01 23:44:41
352
原创 细胞类型注释
细胞类型注释:根据细胞的特征基因(marker基因)进行注释,一般情况是预先并不知道该特征基因对应的细胞类型,所以需要通过用细胞的特征基因对细胞类型进行注释,判断。注释的方法:2. 自动注释:SingleR, Cellassign, Celaref, Garnett, scTPA, Cell Blast, scCATCH.SingleR注释:main大类注释fine小类注释手动注释:经典的细胞marker, 来自于文献整理。...
2021-08-10 10:00:12
7718
原创 R进行批量文件的重命名
allfile <- list.files()for (f in allfile) { newname <- sub(".csv",".xlsx",f) #for循环内的每行是运行命令行,不是参数,不能加“,” file.rename(f,newname) }dir()
2021-08-01 21:27:24
1331
原创 apply函数
apply函数运用矩阵进行计算,一行或一列地运行用法:apply(array, margin, function)参数含义:array: 计算的数据margin: 按行或列计算function: 运行的函数运行代码:matrix <- matrix(c(1:10), nrow = 5, ncol = 6)rows <- apply(matrix, 1, sum) # 1 is rowcols <- apply(matrix,2,sum) # 2 is col运行结
2021-07-29 15:02:23
907
原创 单细胞测序在非小细胞肺癌T细胞中的应用
单细胞测序获得非小细胞肺癌的T细胞特征图谱参考内容https://www.bilibili.com/video/BV1za4y1v7gF/?spm_id_from=trigger_reload对这篇文章一点感觉也没有,感觉就是一群细胞。从1.2万样本中获得细胞并进行单细胞测序。对T细胞样本进行分成16类,并且确定细胞类型,细胞的特征基因。首先研究的是CD8+T细胞的发育过程和由肿瘤影响的单细胞发育过程。患者预后和CD4+调节性T细胞的探索。并且研究CD8+的T细胞...
2021-07-28 21:38:19
360
原创 AlphaFold2
DeepMind的AlphaFold 2解读! 蛋白质折叠的AI突破!https://www.bilibili.com/video/BV1Bh411Z74n/?spm_id_from=trigger_reloadhttps://www.bilibili.com/video/BV1Bo4y197Yv?from=search&seid=13773497593136628881https://www.bilibili.com/video/BV1cT4y1M7jK?from=search&s
2021-07-27 14:00:49
922
原创 R 字符串分割
RGENES = "ABLIM1, ACTN1, AIF1, APBA2, APEX1, ARHGAP45, ARHGEF18, ATM, BACH2, BEX4, C1orf162, C1orf228, C6orf48, CA6, CAMK4, CCR7, CD248, CD55, CEP68, COQ8A, DGKA, EEF2, EIF3E, EIF3L, EPHX2, EXOSC8, FAM102A, FAM117B"Gene = strsplit(GENES,split = ",", perl
2021-07-23 13:24:41
705
原创 单细胞测序的marker基因
参考内容single cell marker 基因数据库https://www.jianshu.com/p/9d7789cc6d97CellMarker:用来做细胞标记,很nicehttps://zhuanlan.zhihu.com/p/300613622数据库:cellMarkerhttp://bio-bigdata.hrbmu.edu.cn/CellMarker/search.jsp?species=Human&tissue=Blood&cellname=B%20
2021-07-23 13:19:41
3822
原创 R对文件夹下所有文件统一处理
设定工作目录: setwd()将文件夹下所有文件名输入给1个变量: list.files()构建获取文件的路径: paste函数读取文件个数,以确定循环次数: length()依次读取文件: for循环循环操作输出文件library(rtracklayer)gtf = import("E:\\lab\\gencode.v29.annotation.gtf")gtf = as.data.frame(gtf)colnames(gtf)head(gtf)gtf_gene <- g.
2021-07-23 00:05:13
2309
原创 GEO数据库数据下载
GEO(Gene Expression Ommius datasets):该数据库搜集了大量表达谱,甲基化,lncRNA,miRNA,CNV等芯片数据该数据信息包括了:GPL:GEO Platform 数据平台GSM: GEO Sample 样本的IDGSE: GEO Series 研究IDGDS: GEO Datasets 数据集的ID该数据类型包括了:SOFT:包括了探针与基因对应关系的注释文件,样本单独表达量,所有信息文件。MINIML : XML格式的所有数据Series
2021-07-21 17:21:54
1915
原创 安装miniconda 及 生物学软件
安装miniconda参考内容https://www.bilibili.com/video/BV1MV41117SD?from=search&seid=14095988536494616638下载安装miniconda的bash脚本mimiconda有不同平台的,由于我使用的是linux,因此采用linux版本的miniconda: Miniconda3-latest-Linux-x86_64.sh下载成功后,直接运行安装的脚本。设置miniconda安装目录安装成功后,激活co
2021-07-21 15:28:38
510
原创 Rtudio,plot不出图
Rtudio,plot不出图法1dev.off()dev.new()如果不行,重启RSTUDIO,再不行,就重启电脑吧。重启是解决人生烦恼的必备良药法2我捉摸着你的问题答案就在Pane Layout里面,把下拉框没显示的选择项打开,Plots打勾法3在画图之前先执行:dev.off() 就好了法4请更新至最新的R版本结果,全部无用...
2021-07-09 11:26:14
6439
原创 R包 splatter
splatter包如何下载?splatter包是模拟单细胞测测序数据的R包,可以从Bioconductor官网上下载。如何寻找帮助理解运行splatter包?了解splatter包的帮助信息可在R上通过以下方式寻求帮助。library(help = "splatter")该方式会在R的control界面上显示帮助信息。其次在安装包的安装位置找到doc文件夹,里面有小品文,可获得相关帮助信息:R-script, html, pdf。在Bioconductor官网上,对于每一个R包,也有R
2021-07-09 11:15:05
727
原创 PCA降维
PCA主成分分析:principle component analysis参考内容:什么是主成分分析PCA:https://www.bilibili.com/video/BV1E5411E71z/主成分分析是为了给数据降维,减少数据的存储内存。例如:位于平面坐标系的二维数据信息降低到一维平面。该图表明示例降维的情况PCA就是要找到这么一个坐标系,从而降低数据的维度。PCA中有两个内容:主成分1和主成分2主成分1:在坐标系该位置降维的信息量很大,各个数据点投影到该位置方差最大。主成分2:
2021-07-09 10:21:28
149
原创 scRNA-seq Course 学习
昨天和今天都在学习scRNA-seq测序的教程。scRNA-seq是对单个细胞进行测序分析,便于研究细胞的异质性。scRNA-seq和bulk-RNA-seq相似,区别只在于研究的细胞数量,后者是对同一组织的大量细胞进行转录组的分析,而前者是对单个细胞进行转录组分析。scRNA-seq的流程是制备单细胞,单细胞水平测序,数据分析。昨天看到了分离单细胞和测序平台的方法上。在分离单细胞方法有mirco-well plate、micro-fluid seq, droplet seq,分别是让细胞在微板上
2021-07-07 15:04:56
6724
原创 numpy包学习笔记ing
###### numpy的学习笔记# numpy:快速,科学计算的包import numpy as np#(一)通过numpy创建数组#1.用列表的形式生成数组a = np.array([1,2,3,4,5,6])np.array([1,2,3,4,5,6])print(type(np.array([1,2,3,4,5,6])))#2.生成数组,并定义数据类型np.array([22,23,45],dtype = np.int)#3.生成矩阵np.array([[1,2,3],[
2021-07-06 15:13:44
127
原创 安装不同来源R包的方法
R语言是一个强大的数据分析工具,其强大之处在于多种R包用于实现各种各样的功能。接下来介绍不同来源R包的安装方法参考链接:“R语言入门之R包的安装” : https://zhuanlan.zhihu.com/p/1290699101)R官网 (https://www.r-project.org/)查看所安装包是否在R上:https://cran.r-project.org/如果在R官网中,那么可以在Rstudio上输入以下命令install.packages("fitdistrplus")如
2021-07-06 15:06:45
1505
原创 2021-04-21
头文件&库文件2.https://blog.youkuaiyun.com/weixin_42458272/article/details/106193786https://zhuanlan.zhihu.com/p/128099583lo文件 https://blog.youkuaiyun.com/shenyan008/article/details/8176380o: 编译的目标文件a : 静态库so:动态链接库(共享库 share)pkg-config 命令#-cflags 查..
2021-07-03 21:45:24
132
原创 可操作 转载 安装cpan软件包&软件包
1、查看是否安装cpan软件包:#rpm -qa |grep perl-CPAN2、如果没有安装,则进行安装:#yum install perl-CPAN*3、安装完成后,则可以通过cpan来安装相应模块。比如我要安装IPC::System::Simple模块:#cpan IPC::System::Simple………4、安装完成后,查看文档:#perldoc IPC::System::Simple将会列出相应的用法和说明。Linux上安装Perl模块的两种方法Linux/Unix下
2021-07-03 21:45:11
851
原创 2021-04-26 线性代数 第1周
线性代数第一周第1讲线性代数绪论线性代数应用案例:交通网络流量代数重建投入产出问题网页等级简单种群增长问题第2讲 矩阵
2021-07-03 21:43:09
241
原创 2021/05/11
linux shell:根据文件大小读取筛选内容:#! /bin/bashfor file in $(ls ./ | grep sequence.txt)doecho $filelength=$(sed -n '2p' $file)number=$(echo ${#length})echo $numberif (($number > 500)) && (($number < 1500));thensed -n '1,2p' $file >> seq
2021-07-03 21:42:48
90
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人