自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(454)
  • 资源 (15)
  • 收藏
  • 关注

原创 Aliee,Bengio and Theis:细胞数据上的因果机器学习

因果学习与单细胞

2025-04-02 22:11:32 673

原创 TextGrad:案例

TextGrad案例

2025-03-28 21:39:47 660

原创 TextGrad:文本梯度优化生成式AI

TextGrad

2025-03-28 14:04:29 730

原创 未来基于参考映射的单细胞数据分析

参考映射的展望

2025-03-26 19:22:01 879

原创 scNET:整合scRNA-seq和PPI用于学习基因和细胞的embedding

scNET

2025-03-24 23:05:27 805

原创 Evo2:跨所有生命领域的基因组建模与设计

Evo 2

2025-03-20 22:12:53 960

原创 Nature | TabPFN:表格基础模型用于小规模数据分析

TabPFN

2025-03-14 20:41:50 893

原创 DrBioRight2.0:用于癌症蛋白组分析的生物学聊天机器人

DrBioRight

2025-03-13 20:56:22 708

原创 推理LLMs发展综述:从GPT到DeepSeek

推理LLMs发展综述:从GPT到DeepSeek

2025-03-10 18:54:53 1023 1

原创 ProteinTalks:蛋白组学上的扰动基础模型

蛋白组的扰动模型

2025-03-06 15:23:14 978

原创 scBaseCamp:一个AI代理的可持续扩充的单细胞数据存储库

scBaseCamp:一个AI代理的可持续扩充的单细胞数据存储库

2025-03-05 21:36:59 1136

原创 Tahoe-100M:最大规模的单细胞扰动数据集

Tahoe-100M-最大规模单细胞扰动数据集

2025-03-05 17:00:03 1023 2

原创 IJCV2025综述-在线测试时适应(2):基于数据的OTTA和基于模型的OTTA

在线测试时适应综述(2)-基于数据的OTTA和基于模型的OTTA

2025-03-04 17:35:06 612

原创 IJCV2025综述-在线测试时适应(1):基于优化的OTTA

在线测试时适应综述(1)-基于优化的OTTA

2025-03-03 17:34:49 799

原创 综述概览:生物信息中的基础模型

综述:生物信息中的FMs

2025-02-17 21:41:53 495

原创 IntegrAO整合不完整数据以实现患者分层

IntegrAO整合不完整多组学数据

2025-02-13 15:57:45 999

原创 ESM3(1)-介绍:用语言模型模拟5亿年的进化历程

ESM3(1)-介绍

2025-02-12 20:27:40 727

原创 ESM2和ESM fold:语言模型进行原子级结构预测

ESM2和ESMFold

2025-02-11 19:10:36 1302

原创 ESM-IF1:从AF2的预测结构中学习逆折叠

ESM-IF:逆折叠

2025-02-07 23:32:26 1924

原创 ESM-1v:突变对蛋白质功能影响的零样本预测

ESM-1v预测突变效应

2025-02-05 00:16:23 1429

原创 人工智能构建虚拟细胞

AIVC

2025-02-04 16:35:52 768

原创 MSA Transformer

ESM-MSA-1b

2025-01-31 22:01:30 828

原创 ESM-1b无监督学习 2.5 亿条蛋白质序列并揭示生物结构和功能

ESM-1b

2025-01-31 15:58:20 1219

原创 ProGen生成功能蛋白序列

ProGen生成功能特定的蛋白质序列

2025-01-28 01:32:03 953

原创 PTMD2.0-疾病相关的翻译后修饰数据库

PTM-D

2025-01-25 17:25:55 1304

原创 GET-跨人体细胞类型的转录调控基础模型

GET:转录调控基础模型

2025-01-22 19:38:55 725

原创 TREE用于识别癌症基因

构建异构调控网络,Transformer学习子图,节点预测

2025-01-21 20:03:10 647

原创 Stable Cox Regression用于分布偏移下的生存分析

Stablelearning在生存分析中的应用

2025-01-20 11:10:16 1017

原创 使用机器学习在单细胞水平识别肿瘤细胞

机器学习预测肿瘤细胞和正常细胞

2024-12-25 16:49:31 1303

原创 建立在商用GPT上的简单高效单细胞表示模型

简单高效的细胞数据embedding方法

2024-12-18 20:52:42 1644 4

原创 STitch3D方法解读

STitch3D方法

2024-12-13 13:09:24 897

原创 肿瘤微环境中单细胞的泛癌分类

Pan-cancer上随机森林分层分类

2024-11-29 14:29:27 1325

原创 使用 popV 对单细胞数据中的细胞类型标签进行一致性预测

细胞分类与不确定度估计

2024-11-27 14:15:53 1344 1

原创 基于深度学习从omics数据中获取基因的解释

xAI在sequence-to-activity model上的应用

2024-11-27 10:46:23 1005

原创 scPair:隐式特征选择提高single-cell paired多模态分析

scPair

2024-11-21 13:57:03 1083

原创 PRODIGY在图上实现上下文学习

图的上下文学习

2024-11-18 19:49:58 1159

原创 使用基于细胞或组织学图像的深度学习预测原发来源不明癌症的肿瘤起源

预测不明来源癌症的起源

2024-11-16 20:21:40 1222

原创 展望:多模态融合与marker推断

多模态融合----展望

2024-11-11 17:00:38 1057

原创 机器学习分析scRNA-seq解析急性髓系白血病中的疾病和免疫过程

AML发展过程分析

2024-11-11 15:37:15 1113

原创 scIDST:弱监督学习推断单细胞转录组数据中的疾病进展阶段

scIDST用概率标签代替伪标签,分类患病细胞

2024-11-03 16:53:24 974

红楼梦人物图谱csv文件

红楼梦人物图谱csv文件

2023-08-30

mackey_glass_t17.npy

Mackey-Glass (MG)序列的部分内容,shape为(10000,),这个时间序列是混乱的,没有明确的周期。 级数不收敛也不发散,轨迹对初始条件高度敏感。 这个基准问题用于神经网络和模糊建模研究。

2021-07-12

Kaggle交易预测.rar

基于 Kaggle 竞赛数据,原始数据文件较大,故本数据集只选用了 train.csv 中的 5 万条样本作为模型训练集(train.csv.gzip),1 万条样本作为模型测试集(test.csv.gzip)

2021-02-17

olivetti_py3.pkz

人脸图像数据集 olivetti_py3.pkz,该数据集一共有 400 张人脸图片,每张图片的大小是:64x64,每张图片作为一个样本,一共有 400 个样本,每个样本的特征维度是:64x64 = 4096;400 张图片一共包含 40 个不同的人,每个人有 10 张人脸图片

2021-02-13

随机森林评估特征重要性wine.rar

基于 UCI 葡萄酒数据,使用随机森林进行特征重要性分析,这些数据是对意大利同一地区种植的三种不同品种葡萄酒的化学分析结果,分析确定了三种葡萄酒中13种成分的含量,数据的第一列是葡萄酒的类别

2021-02-02

决策树预测用户流失data.csv

基于某信息公司的用户数据,使用决策树预测用户是否会流失,字段Churn代表客户是否流失,取值:['Yes', 'No'],其余字段为特征

2021-02-01

基于朴素贝叶斯的垃圾邮件过滤data.rar

邮件数据包括训练集train(正常邮件normal,垃圾邮件spam),测试集test,中文停用词文件cn_stopwords.txt

2021-01-31

LR预测CTR数据集data.zip

数据集是电商领域数据集,共计200万的样本记录。原始特征均为ID类特征; 字段说明: userid 用户ID itemid 商品ID categoryid 商品类目ID action 用户行为类型 timestamp 时间戳

2021-01-25

机器翻译nmt.zip

轻量级机器翻译数据集,en-cn为英文与中文,en-fr为英文与法文

2021-01-22

nltk_data.rar

nltk的分词工具,将其解压,放置到当前虚拟环境(假设环境名为TORCH),则目录结构为"TORCH/nltk_data/tokenizers/punkt"

2021-01-22

google.csv

机器学习第六课,使用线性回归预测未来30天 Google 股票的收盘价走势,表格中的列代表每天的股票指数,如:Open 开盘价、High 最高价、Low 最低价、Volume 成交量。Adj. Open、Adj. High、Adj. Low、Adj. Close、Adj. Volume 代表调整后的数据

2021-01-15

hymenoptera_data.zip

hymenoptera_data数据集,这个数据集包括两类图片, bees 和 ants, 这些数据都被处理成了可以使用"torchvision.datasets.ImageFolder"来读取的格式。

2020-12-02

glove.6B.100d.txt.zip

glove.6B是斯坦福大学训练的词向量包(862MB),glove.6B.100d是100维词向量,TEXT.build_vocab可以根据我自己的词汇表内的词匹配到glove内的词,组建成为需要的词向量;后面如果想使用这个新词向量,可以通过TEXT.vocab.vectors返回

2020-11-29

MNIST与FashionMNIST数据集

数据集包括了MNIST和FashionMNIST,有原始数据集raw和经过torchvision.datasets处理过的processed目录

2020-11-29

TextSet.zip

该文件用于词向量训练,Skip-Gram训练,主要是texttrain.txt文件,训练细节见白景屹的Pytorch笔记本-第四课.词向量:https://blog.youkuaiyun.com/qq_40943760/category_10532835.html

2020-11-09

fasterRCNN口罩检测

使用fasterrcnn实现口罩检测,fasterrcnn基于keras搭建,训练需要口罩数据集,数据集必须是VOC格式,预测需要权重文件,权重文件已经存在

2020-05-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除