自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

白景屹的博客

原创 Information Fusion | 多模态单细胞，以及分子（gene与peak）整合

多模态细胞，分子整合

2025-11-24 11:35:14 833

原创 CellNavi实验结果

CellNavi实验结果

2025-11-12 21:26:53 666

原创 CellNavi方法细节：预测指导细胞状态转移的基因

CellNavi方法细节：预测指导细胞状态转移的基因

2025-11-09 20:23:02 792

原创 LLM-based Agent

一文遍历常用AI Agent

2025-10-30 20:12:41 640

原创 Genome Biology｜Cell Decoder解释细胞中的多尺度异质性

Cell Decoder：解码细胞的多尺度异质性

2025-10-23 11:10:05 761

原创 DeepSeek-OCR：上下文光学压缩

DeepSeek-OCR

2025-10-21 22:21:32 928

原创 News | 强化学习的缩放定律

强化学习缩放定律

2025-10-18 12:16:08 359

原创 DiT与表征自编码器RAE

表征自编码器

2025-10-15 20:18:36 990 1

原创 AI作为操作系统已经不能阻挡了，尽管它还没来

AI作为操作系统

2025-10-07 21:21:57 1119

原创 Genome Biology | scKAN：连接单细胞数据分析与药物发现的可解释架构

scKAN：连接单细胞数据分析与药物发现的可解释架构

2025-09-28 23:02:24 1250

原创 Information Fusion | Modal-NexT：统一的多模态细胞数据整合

Modal-NexT

2025-09-28 22:26:00 372

原创理解虚拟细胞：初学者指南

虚拟细胞入门指南

2025-09-18 13:42:10 1149

原创 DeepConf：基于置信度提高LLM表现

DeepConf

2025-08-30 14:22:12 1217

原创 rbio1：以生物学世界模型为软验证器训练科学推理大语言模型

rbio1：以生物学世界模型为软验证器训练科学推理大语言模型

2025-08-25 19:32:42 1144

原创虚拟细胞比赛注意事项

虚拟细胞比赛注意事项

2025-08-25 15:22:53 870

原创 CellForge：AIVC的智能体设计

CellForge

2025-08-20 15:56:55 693

原创深度学习与线性模型在扰动预测上的比较

深度学习与线性模型在扰动预测上的比较

2025-08-18 21:26:43 1170

原创 MatterGen：用于无机材料设计的生成模型

mattergen生成材料

2025-08-12 15:07:17 1431

原创能力显著性向量：验证损失与下游能力的缩放定律

验证损失与下游能力的缩放定律

2025-08-02 22:59:35 987

原创 Re-TASK：从能力、技能和知识视角重新审视LLM任务

Re-Task：延续CoT的分解任务，进一步生成能力项以加强回应

2025-07-31 17:25:58 973

原创 OriGene：一种可自进化的虚拟疾病生物学家，实现治疗靶点发现自动化

OriGene：自进化Agent用于靶点发现

2025-07-30 17:04:47 1432

原创人类语言驱动物理机制建模的AIVC

基于规则建模虚拟细胞

2025-07-30 14:44:01 1284

原创构建特定领域的大模型

构建领域特定大模型的概述

2025-07-29 17:30:10 1244

原创 CellFlow：Flow matching建模cell状态变化

流匹配建模细胞扰动响应

2025-07-24 17:57:55 1265

原创 DPO详解

DPO详解

2025-07-20 17:00:20 1477

原创 MiniMind（3）训练

MiniMind（3）训练

2025-07-20 15:46:43 915

原创 Arc虚拟细胞挑战入门指南

Arc虚拟细胞挑战入门指南

2025-07-19 10:49:25 1596

原创 SymAgent（神经符号自学习Agent）

神经符号自学习Agent

2025-07-18 21:49:41 931

原创 Agent AI（3）：Agent分类

Agent AI（3）

2025-07-18 17:07:27 922

原创 Agent AI（2）：Agent范式

Agent AI（2）

2025-07-11 00:21:24 937

原创 Agent AI（1）：多模态交互智能中的背景和动机

Agent AI（1）

2025-07-09 17:46:30 1102

原创 MiniMind（2）模型架构

MiniMind（2）模型架构

2025-07-02 16:38:06 993

原创 KV Cache

KV Cache

2025-06-30 20:11:14 604

原创 State：SE编码单个细胞，ST学习细胞集合上的扰动

STATE：预测扰动响应

2025-06-30 16:28:35 1284

原创三种强化学习方法：PPO，DPO，GRPO

PPO，DPO，GRPO

2025-06-25 15:48:32 1747

原创 MiniMind（1）Tokenizer与训练数据

minimind part1：tokenizer与训练数据

2025-06-13 14:13:09 1028

原创 Biomni：通用生物医学AI Agent

Biomni：生物医学AI Agent

2025-06-11 16:51:04 1736

原创 Cell-o1：强化学习训练LLM解决单细胞推理问题

Cell-o1

2025-06-07 17:27:26 1254

原创 GEARS以及与基础模型结合

GEARS预测扰动响应

2025-05-30 16:21:21 1620

原创 C2S-Scale方法解读

C2S-Scale方法解读

2025-05-18 15:19:01 1199

红楼梦人物图谱csv文件

红楼梦人物图谱csv文件

2023-08-30

nltk_data.rar

nltk的分词工具，将其解压，放置到当前虚拟环境（假设环境名为TORCH），则目录结构为"TORCH/nltk_data/tokenizers/punkt"

2021-01-22

随机森林评估特征重要性wine.rar

基于 UCI 葡萄酒数据，使用随机森林进行特征重要性分析，这些数据是对意大利同一地区种植的三种不同品种葡萄酒的化学分析结果，分析确定了三种葡萄酒中13种成分的含量，数据的第一列是葡萄酒的类别

2021-02-02

fasterRCNN口罩检测

使用fasterrcnn实现口罩检测，fasterrcnn基于keras搭建，训练需要口罩数据集，数据集必须是VOC格式，预测需要权重文件，权重文件已经存在

2020-05-26

基于朴素贝叶斯的垃圾邮件过滤data.rar

邮件数据包括训练集train（正常邮件normal，垃圾邮件spam），测试集test，中文停用词文件cn_stopwords.txt

2021-01-31

机器翻译nmt.zip

轻量级机器翻译数据集，en-cn为英文与中文，en-fr为英文与法文

2021-01-22

LR预测CTR数据集data.zip

数据集是电商领域数据集，共计200万的样本记录。原始特征均为ID类特征；字段说明： userid 用户ID itemid 商品ID categoryid 商品类目ID action 用户行为类型 timestamp 时间戳

2021-01-25

glove.6B.100d.txt.zip

glove.6B是斯坦福大学训练的词向量包(862MB)，glove.6B.100d是100维词向量，TEXT.build_vocab可以根据我自己的词汇表内的词匹配到glove内的词，组建成为需要的词向量；后面如果想使用这个新词向量，可以通过TEXT.vocab.vectors返回

2020-11-29

决策树预测用户流失data.csv

基于某信息公司的用户数据，使用决策树预测用户是否会流失，字段Churn代表客户是否流失，取值：['Yes', 'No']，其余字段为特征

2021-02-01

MNIST与FashionMNIST数据集

数据集包括了MNIST和FashionMNIST，有原始数据集raw和经过torchvision.datasets处理过的processed目录

2020-11-29

hymenoptera_data.zip

hymenoptera_data数据集，这个数据集包括两类图片, bees 和 ants, 这些数据都被处理成了可以使用"torchvision.datasets.ImageFolder"来读取的格式。

2020-12-02

google.csv

机器学习第六课，使用线性回归预测未来30天 Google 股票的收盘价走势，表格中的列代表每天的股票指数，如：Open 开盘价、High 最高价、Low 最低价、Volume 成交量。Adj. Open、Adj. High、Adj. Low、Adj. Close、Adj. Volume 代表调整后的数据

2021-01-15

mackey_glass_t17.npy

Mackey-Glass (MG)序列的部分内容，shape为(10000,)，这个时间序列是混乱的，没有明确的周期。级数不收敛也不发散，轨迹对初始条件高度敏感。这个基准问题用于神经网络和模糊建模研究。

2021-07-12

olivetti_py3.pkz

人脸图像数据集 olivetti_py3.pkz，该数据集一共有 400 张人脸图片，每张图片的大小是：64x64，每张图片作为一个样本，一共有 400 个样本，每个样本的特征维度是：64x64 = 4096；400 张图片一共包含 40 个不同的人，每个人有 10 张人脸图片

2021-02-13

Kaggle交易预测.rar

基于 Kaggle 竞赛数据，原始数据文件较大，故本数据集只选用了 train.csv 中的 5 万条样本作为模型训练集（train.csv.gzip），1 万条样本作为模型测试集（test.csv.gzip）

2021-02-17

TextSet.zip

该文件用于词向量训练，Skip-Gram训练，主要是texttrain.txt文件，训练细节见白景屹的Pytorch笔记本-第四课.词向量：https://blog.youkuaiyun.com/qq_40943760/category_10532835.html

2020-11-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除