LRaby35646-优快云博客

原创良渚实验室郭国骥/夏宏光团队合作开发单细胞水平筛选抗肿瘤药物的深度学习框架——“神农”

仅将细胞归类为。

2025-04-10 20:21:19 1348

原创服务器中安装 NVIDIA 驱动

运行代码输出：NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running说明：检测到了 NVIDIA 显卡硬件，但无法和它通信，通常是因为：查看系统名称和版本 Ubuntu 示例： CentOS 示例：我的系统是 bash: 有输出 → 说明驱动已加载没输出

2025-04-08 10:46:43 1674

原创分组柱状图：湿实验结果绘制

原始数据🔗方差分析（ANOVA）结合是一种在 ANOVA 显示组间存在显著差异时，进一步用于多重比较的方法，尤其适用于比较多个实验组和一个控制组之间的差异。

2025-02-21 23:30:56 1137

原创交响曲-24-3-单细胞CNV分析及聚类

小于1kb是常见的插入、移位、缺失等的变异人体内包含

2025-01-08 15:05:25 1374

原创更改conda创建虚拟环境的路径

打开之后发现里面没有任何内容，这是正常的情况。这只是说明 Conda 的配置还没有被显式写入到配置文件中。但 Conda 仍有默认配置，它存储在内部。有多个路径但想优先使用Miniconda路径，使用上述命令检查是否修改并保存。2. 打开conda配置文件。使用默认文件名保存并退出。保存，在最左下角会有一个。，直接按 Enter。

2024-11-20 10:52:41 549

转载 Python : ArgumentParser对象及使用

argparse模块的使用

2024-11-07 20:18:36 111

原创 Spearman、Pearson、Euclidean、Cosine、Jaccard，用来衡量不同数据之间的相似性或差异性

排序关系-1到1。

2024-10-23 17:05:06 1887

原创基于openne框架的模型，例如：LINE、HOPE、Node2vec、GraRep, 为节点生成向量

OpenNE 的目标是提供统一的接口和框架，帮助研究人员和开发者快速实现和测试各种图嵌入算法。通过 OpenNE，你可以在各种图结构数据上生成节点的嵌入向量，这些向量可以用在下游的任务中，如节点分类、链接预测和社区检测等。，每个向量表示一种关系。总的来说：OpenNE 专注于网络嵌入，而 PyTorch 是一个通用的深度学习框架。通过受控的随机游走平衡局部和全局结构信息。模型将网络节点表示成向量后，节点的。的节点关系，强调一阶和二阶邻接关系，适合大规模网络。的框架，它集成了多个常用的图嵌入算法，例如。

2024-10-21 10:59:33 626

原创小写→大写，大写→小写，只保留首字母大写的三种方法

【代码】小写→大写，大写→小写，只保留首字母大写的三种方法。

2024-09-17 11:23:28 395

原创四种分子指纹的介绍：Substructure Fingerprint（子结构指纹）、PubChem 分子指纹、MACCS 分子指纹、ExtFP分子指纹

1.（子结构指纹）以为前缀的分子指纹通常指的是（子结构指纹）。子结构指纹是一种基于化学子结构的分子表征方法，广泛用于分子信息学、药物发现和虚拟筛选等领域。

2024-09-14 11:22:06 6039

原创随机生成150个节点，200条边

中用作变量名，这种用法通常表示我们并不关心循环变量的实际值。也就是说，在循环过程中，虽然每次循环都会产生一个数值（例如。因此，使用下划线作为变量名是一种约定俗成的方式，表示这个变量虽然存在，但不会被使用，避免了给它起一个没意义的名字。），但该数值并不需要在循环体内被使用。在 Python 中，

2024-09-12 20:59:56 306

原创 DataFrame行、列迭代

【代码】DataFrame行、列迭代。

2024-09-09 14:48:26 352 1

原创 DataFrame 列选择,返回的是DataFrame还是Series?

DataFrame 列选择,返回的是DataFrame还是Series?

2024-09-05 10:50:14 383

原创二分类、多分类、多标签分类的评价指标

每个样本只能属于两个类别中的一个每个样本只能属于多个类别中的一个。准确率是正确分类的样本数占总样本数的比例。精确率是模型正确预测的正类样本数占所有预测为正类的样本数的比例。召回率是模型正确预测的正类样本数占所有实际为正类的样本数的比例。F1分数是精确率和召回率的调和平均数。混淆矩阵是一个表格，用于描述模型预测结果的表现。ROC AUC 是 ROC 曲线下的面积，衡量模型的分类性能分类报告汇总了精确率、召回率和 F1 分数等指标。

2024-07-29 17:57:20 8430

原创 Linux系统下载htop

在Linux系统上安装htop的具体步骤取决于Linux发行版。下面是常见的Linux发行版。

2024-07-19 20:35:14 1997

原创 miniconda安装

例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考。

2024-07-19 17:27:08 44939 2

原创计算样本之间的相似度

计算样本之间的相似度通常可以通过计算样本之间的距离来实现，尽管这不是唯一的方法。距离度量和相似度度量是两个相关但不同的概念。距离度量通常用于表示样本之间的不相似程度，而相似度度量则用于表示样本之间的相似程度。在距离度量的五种方法中，欧几里得距离（Euclidean Distance）、曼哈顿距离（Manhattan Distance）、余弦距离是最常用的三种。欧几里得距离：适用于低维和中维数据，广泛用于各种机器学习算法。（低维通常在1-10维之间，中维在10—100之间）

2024-07-07 22:21:03 1024

原创 XGBoost模型中参数stratify的作用

在使用 XGBoost 进行分类和回归任务时，需要设置不同的参数来指定模型的类型。然而，当从分类任务切换到回归任务时，标签 y 是连续值而不是离散的类别，因此 stratify 参数就不再适用了，因为 stratify 只能用于分类任务中的类别平衡。当数据集的类分布不均衡时，直接进行随机分割可能会导致训练集和测试集中类的比例不一致，从而影响模型的性能和评估结果。为了确保训练集和测试集中的类分布与原始数据集中的类分布一致，可以使用 train_test_split 函数中的 stratify 参数。

2024-07-07 20:55:44 699

原创分类模型、回归模型的常见评价指标

相比较于均方误差，均方根误差，平均绝对误差，决定系数，校正决定系数来说，皮尔逊相关系数和斯皮尔曼秩相关系数并没有那么适合用于回归模型的评估。

2024-07-06 17:08:03 2000

原创给csv或txt文件加上一列id

从这样变成这样。

2024-07-06 15:04:15 488

原创 synergy_bliss，synergy_hsa，synergy_loewe，synergy_zip的用法

Synergy 是指多种药物联合使用时所产生的协同作用效果。常见的 Synergy 计算方法包括 Bliss、HSA、Loewe 和 ZIP。Bliss 模型基于独立作用原理，假设两个药物在无交互的情况下独立起作用HSA 模型假设联合用药效果不超过最强单药效果。Loewe 模型基于剂量加成原理，假设联合用药效果等同于等效剂量单药效果。ZIP 模型结合 Bliss 和 Loewe 模型，通过零交互效应假设来评估协同作用。

2024-07-02 22:29:47 4606

原创 enumerate函数

enumerate(iteration, start)函数默认包含两个参数，其中iteration参数为需要遍历的参数，比如字典、列表、元组等，start参数为开始的参数，默认为0（不写start那就是从0开始）。enumerate函数有两个返回值，第一个返回值为从start参数开始的数，第二个参数为iteration参数中的值。提示：以下是本篇文章正文内容，下面案例可供参考。

2024-06-24 10:46:55 459

原创 random.choices()和random.sample()函数的区别

在Python编程语言中，sample函数是一个用于随机抽样的实用工具，它属于random模块的一部分。通过使用sample函数，我们可以从给定的数据序列中随机选取一定数量的不重复元素。

2024-06-24 10:28:25 1863

原创 isin() 以及.loc[ ]的使用

解释：drug_disease_pd[‘drug’].isin(embeddingf_matrix.keys()) 生成一个。drug_disease_pd[‘disease’].isin(embeddingf_matrix.keys()) 生成一个。isin()方法用于过滤数据框（DataFrame）或序列（Series）中的值，仅保留在给定列表中出现的值。，标示每个 disease 是否在 embeddingf_matrix 的键中。这是一种常用的方法来基于条件选择 DataFrame 中的数据行。

2024-06-22 22:43:30 519

服务器中的数据迁移讲解

空空如也