- 博客(40)
- 资源 (2)
- 收藏
- 关注
原创 单细胞分析教程 | (二)标准化、特征选择、降为、聚类及可视化
本文介绍了单细胞RNA-seq数据分析的核心流程,包括数据标准化、特征选择、降维、聚类和可视化。通过Python的Scanpy工具包,首先对质控后的数据进行归一化和对数化处理,然后筛选高变基因减少噪声。使用PCA和UMAP方法进行降维和可视化,并通过Leiden算法进行细胞聚类。最后利用已知标记基因对细胞簇进行初步注释,并展示标记基因表达模式。该流程为后续差异表达分析和细胞类型鉴定奠定了基础,并提供了保存中间结果的建议。
2025-07-12 20:33:56
1575
原创 本地安装ClaudeCode全攻略
Claude Code 是 Anthropic 推出的一款本地运行的 AI 编程工具,能够理解代码库、执行命令、管理 Git 仓库,并支持 MCP 等功能,是开发者提升效率的利器。介绍的比较官方哈,好不好用大家都知道,我们主要是为了,能用两天是两天!Claude Code 官网:本文将详细介绍在 macOS 系统上安装 Claude Code 的步骤,并分享一个在国内网络环境下无需翻墙、免费使用 Claude Code 的方法。最好在Linux和macOS上进行安装,Windows上安装需要wsl。
2025-07-12 16:41:38
1779
原创 Nature | 新方法moscot:单细胞时空图谱的“导航系统”
该方法不仅突破了传统OT方法的局限,还能处理百万级细胞的发育轨迹重建、空间转录组数据增强及多切片对齐,并在小鼠胚胎发育、肝脏和大脑研究中验证了其高效性,为解析复杂生命过程提供了全新工具。:现有OT工具仅支持单一数据类型(如基因表达),无法整合多组学信息(如染色质可及性、蛋白质表达)。的发育轨迹,准确性媲美定制化工具TOME,且生长率预测更符合生物学实际(如凋亡率<10%)。:传统OT计算复杂度高(时间/内存随细胞数平方增长),难以应用于百万级单细胞图谱。型:跨不同空间的数据对齐(如空间切片)。
2025-03-11 18:04:45
693
原创 Nat. Methods | scPerturb——单细胞扰动数据的标准化资源与统计分析方法
不同数据集E-距离差异显著,如NormanWeissman2019(CRISPRa双靶点)的平均E-距离最高。:不同研究的数据格式、技术(CRISPR、小分子药物等)和测序深度差异显著,跨数据集分析困难。,涵盖CRISPR基因编辑(knockout/i/a)、药物扰动、细胞因子刺激等多技术平台。(9个),CRISPR技术占比72%(基因敲除/激活/干扰),药物扰动占比21%。(如TGFBR2敲除):E-距离低(<10),细胞群与对照组重叠。缺乏统计工具比较扰动效果的差异(如基因敲除与药物扰动的对比)。
2025-03-11 17:58:57
1438
原创 DeepSeek系列 | 给Ollama模型换个窝--C盘拯救计划
不少朋友在本地部署DeepSeek时,应该都接触过Ollama这个工具吧?不过跟着教程操作时,很多人可能都没注意——对于有安装强迫症的朋友来说,这种"占山头"的行为简直让人抓狂(懂的都懂.jpg)很多图文教程甚至是B站上的视频教程,都讲的太复杂了!想要解决问题本质上非常简单!不仅之前下载的模型都已经移动到了当前目录下,后续下载的模型同样会自动保存在这里。所有已经下载的模型都保存在这里。1. 按win键后,按照图示,点击编辑系统环境变量。不要忘记把C盘中的文件删掉!两个文件夹,别管乱七八糟的,
2025-03-04 14:40:10
650
原创 Nat Mach Intell | AI分子对接算法评测
活性分子取自TrueDecoy,非活性分子随机选自商业库(比例1:100或1:300),贴近真实药物筛选(图b,d)。:含147个靶点,活性分子与真实实验验证的低活性分子(活性-非活性比例1:40),模拟高挑战性筛选场景(图a,c)。去除PDBbind重复数据后,AI工具成功率下降30%,而物理方法稳定,提示现有AI模型泛化能力不足。:CarsiDock全面胜出(EF_1%=43.5),显示AI在真实化学库筛选中的潜力。:扩展至700万分子库,验证算法在大规模VS中的实用性。
2025-03-03 19:24:21
1160
原创 Nat. Methods | 单细胞多组学算法大比拼!
但是与RNA表达相关性低的蛋白(如CD223)预测误差显著增加(RMSE >1.16),表明算法对非转录调控蛋白的捕获能力有限。本研究不仅提供了一份算法选择指南,更深层的价值在于揭示单细胞多组学方法开发的新方向:当前算法在跨模态对齐效率、计算资源消耗等方面仍存在明显短板,而结合物理约束的生成式模型可能是突破现有瓶颈的关键路径。,其加权最近邻算法(WNN)对PBMC数据集的整合达到ARI=0.76,能准确识别CD4+ T细胞等亚群的跨模态特征。(如RNA+蛋白、RNA+ATAC),以构建跨模态细胞图谱。
2025-03-02 13:54:54
1024
原创 Nat. Methods | 单细胞大模型scFoundation:在多项单细胞任务中取得最先进性能
scFoundation对19,264个基因进行建模,其中约1亿个参数是在5000多万个scRNA-seq数据上预先训练的。这是单细胞领域中大参数大小、基因覆盖率和数据规模的大规模模型。
2025-03-01 15:23:25
1203
原创 Nat. Methods | 单细胞大模型scGPT:助力单细胞多组学研究
scGPT是全球首个基于生成式预训练(Generative AI)的单细胞多组学基础模型,旨在解决单细胞数据分散、标注成本高、多任务泛化能力差三大难题。双阶段预训练(全局细胞生成与局部基因预测)强化模型理解基因-细胞关系的能力。scGPT通过预训练超过3300万个单细胞数据,实现了对基因和细胞特征的高度理解,并在多种下游任务(如。(如分类器预测细胞类型、回归层输出扰动响应),冻结大部分参数保持通用性,少量微调提升任务精度。,在多发性硬化(MS)数据集上,模型成功区分健康与患病细胞,准确率超0.85。
2025-02-28 14:33:31
1782
原创 Nat. Genet | 从DNA序列预测RNA-seq覆盖率
Borzoi采用基于Enformer模型的神经网络架构,结合卷积层和自注意力层来处理长达524kb的DNA序列,并预测32bp分辨率的RNA-seq覆盖度。该模型通过整合RNA-seq、ChIP-seq、ATAC-seq和DNase-seq等多种数据类型,捕捉不同组织和条件下的调控信息。Borzoi还使用了梯度型的归因方法,分析特定核苷酸对RNA表达模式的影响。
2025-02-26 11:58:27
884
原创 Nature | 单细胞大模型Geneformer:迁移学习开启基因网络预测新时代
Geneformer是首个基于单细胞转录组的预训练迁移学习模型。
2025-02-26 11:49:50
1606
原创 Nat. Biomed. Eng | AI解码癌症基因新突破——TREE模型助力精准抗癌研究
TREE通过整合Transformer架构与图表示学习,构建了首个兼顾多组学数据与生物网络拓扑的癌症基因识别框架,解决了传统模型在可解释性与异质网络泛化性上的不足。
2025-02-25 14:40:47
765
原创 Nat. Commun | 机制驱动的深度神经网络,赋能细胞状态转变调控因子的优先级排序
本文提出了regX,一个机制驱动的深度神经网络模型,旨在识别细胞状态转变过程中起主导作用的调控因子,并提供生物学解释。regX通过结合基因层面调控机制和基因间相互作用,能够对细胞状态转变进行预测,并优先排序潜在的驱动调控因子。该模型特别适用于单细胞多组学数据,能够在分析过程中揭示关键转录因子和候选顺式调控元件(cCREs),并通过模拟干扰提供调控因子的机制性解释。首先,regX通过构建一个转录活动矩阵。
2025-02-24 10:45:44
966
原创 Nat. Mach. Intell | AI药物设计新突破:Delete模型实现高效先导化合物优化
Delete是一种“口袋感知”的三维分子生成模型,专注于先导化合物优化。其核心是通过结构生物学数据驱动,将蛋白结合口袋的几何与能量特征融入分子设计,突破传统方法对二维结构或大量活性数据的依赖,实现更精准的靶向药物设计。关键技术架构解析蛋白口袋的原子坐标与空间取向,确保生成的分子构象满足旋转平移不变性(即无论蛋白结构如何旋转,输出分子拓扑不变);避免数据增强需求,直接生成与口袋匹配的天然构象。通过逐步“删除-预测”循环,动态优化分子结构。
2025-02-24 10:30:02
1523
原创 Nat. Commun | 突破性工具DeepTFBU:重新定义增强子设计,精准调控基因表达
本文提出了一种名为转录因子结合单元(TFBU)的创新概念,并开发了深度学习工具包DeepTFBU,通过量化转录因子结合位点(TFBS)周围序列的调控作用,实现增强子的理性设计。
2025-02-23 13:45:34
1204
原创 生物版本DeepSeek | Evo 2为生物学设计带来新机遇
Evo 2是一个革命性的生物学基础模型,由来自Arc Institute、英伟达、斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的科学家们,联合发布。
2025-02-22 19:11:16
1104
原创 Nat. Genet | 单细胞多组回归模型识别功能和疾病相关增强子,并实现染色质潜力分析
SCARlink使用正则化的泊松回归方法,对单细胞数据中的染色质可及性数据进行建模,预测基因表达。该模型处理的输入数据为500bp大小的非重叠染色质可及性区域,覆盖基因上下游各250kb范围。通过学习回归系数,SCARlink能够确定哪些区域是基因表达的潜在调控元件。模型中还使用Shapley值分析来识别细胞类型特异性的增强子综合调控元件:同时考虑基因座内(如内含子增强子)和侧翼区域(±250 kb)的调控元素tile-level。
2025-02-18 20:46:44
996
原创 2019-nCoV疫情预测-logistics模型
logistics模型简介Logistic函数或Logistic曲线是一种常见的S形函数,它是皮埃尔·弗朗索瓦·韦吕勒在1844或1845年在研究它与人口增长的关系时命名的。广义Logistic曲线可以模仿一些情况人口增长(P)的S形曲线。起初阶段大致是指数增长;然后随着开始变得饱和,增加变慢;最后,达到成熟时增加停止。...
2021-03-05 19:44:09
4518
4
原创 Python中的面向对象(小归纳)
虽然看到我文章的人不多呀,但还是要说一声抱歉呀,因为考研的事情耽误了很久,并且之前学的很多东西也都有丢下。最近我会不定时的补一些东西。就在前天刚刚结束开题报告,然后复盘了一下python中的一些内容,发现python虽然是一款入门较为轻松的开发语言,但是现在网上可以找到的一些教程,对于python面向对象这一方面的介绍却并不多。所以本人准备分享一些我的学习经验呀。====================================================什么是面向对象首先是比较正式的定义
2021-01-16 20:06:02
251
原创 paddlepaddle进行波士顿房价预测
波士顿房价预测是机器学习或者深度学习中一个较常见到的小例子,接下来我会通过对代码的解析为大家正式打开paddlepaddle的大门。一、分析数据首先我们需要了解一下波士顿房价的数据。因为房价预测这个小例子比较经典,所以在很多机器学习的包中都已经封装好了,我们只需要直接调用即可。想要查看数据,我们只需要导入sklearn即可:from sklearn import datasetsv_housing = datasets.load_boston()v_bos = pd.DataFrame(v_hou
2020-05-26 21:17:56
1281
原创 关于paddlepaddle新手教程中的线性回归方程解析
人总是喜欢捣鼓的,最近发现paddlepaddle也是一个比较好玩的东西,所以就下手使用了一下。但是当我开始学习的时候发现自己蒙了,本人本身是没有太多深度学习基础的,顶多也就是知道DNN的结构:输入层、隐藏层、输出层,所以我发现这个玩意学习起来还是有一些吃力的。新手教程的例子就把我给干到了。一、 给出代码废话不多说呀,先给出原文的例子,然后我在一步一步的进行解释:#加载库import paddle.fluid as fluidimport numpy as np#生成数据np.random.s
2020-05-20 12:37:43
586
原创 机器学习--sklearn库的详细学习记录(二)特征预处理
序在对特征数据进行提取时我们通常会遇到以不同单位(衡量单位)的数据,其中较为典型的数据就是海伦约会数据,下面给出部分数据:40920 8.326976 0.953952 largeDoses14488 7.153469 1.673904 smallDoses26052 1.441871 0.805124 didntLike75136 13.147394 0.428964 didntLik...
2020-04-05 22:36:23
370
原创 机器学习--sklearn库的详细学习记录(一)特征提取
本人反思了之前学习的方法,总的来说还是如同我的上一篇机器学习(Python)–sklearn库相关内容中说的,不应该按照网上给的那些千篇一律的东西来学习。所以本人在试水了之后决定对我的学习记录进行重新规划。所以本人准备按照模块来进行记录我的学习笔记。机器学习–特征工程我们在理解了机器学习的原理之后我们就会了解到,由于我们是希望计算机可以按照我们给定的数据进行学习并总结,从而达到预测的功能。但是...
2020-03-26 17:07:38
463
原创 机器学习(Python)--sklearn库相关内容
一、简介为了能够更好的学习文本挖掘相关的内容,本人准备对机器学习、深度学习等等相关内容都进行一定的了解。今天的内容是关于机器学习中sklearn库的一些介绍和用法。相应的,由于网上的一些内容实在是不咋的,所以本人诚挚推荐大家参照sklearn库的官方文档进行学习。但是官方文档中的内容对于没有入门的小白来说理解起来还是有一些难度的。二、sklearn是什么?2.1、sklearn简介skl...
2020-02-09 17:15:10
985
原创 全网最最良心之jieba(结巴)组件入门
本人这篇文章主要目的就是为了吐槽一下网上可以找到的那些关于jieba的小文章,它们的内容基本上都是按照github上jieba的介绍抄来的,让我的学习毫无半点收获!!!本人会在文章中补充我在学习时碰到的不懂得问题和见解,如果有不对的或者是已经过时的地方,请大家及时指正。1、JIEBA简介一款中文分词组件,有很多的版本,我现在介绍的呢就是Python实现的jieba中文分词。在github上可...
2020-01-24 12:54:06
2139
原创 Matery(Hexo)主题加载gittalk插件
接着之前的博客,我个人使用的是Matery主题,其他的插件相对来说使用起来都较为简单,可能在添加评论系统上会出一些问题,这篇文章就是用来为大家排雷用的。因为有些主题可能没有内置评论系统,所以这也是我建议大家使用next这种大型主题的原因。我使用的主题是Matery,并且使用的评论系统是gittalk。一、在github上创建OAuth Apps完成创建之后会生成Client ID和Cl...
2019-10-26 22:28:15
1780
1
原创 了解Hexo配置文件
由于本人的博客使用的主题是matery,所以关于hexo主题的相关设置都是基于该主题,当然其他的主题的设置也都相差不多。这是我的个人博客链接,欢迎大家参观:http://101.132.119.152/1、熟悉博客的配置文件首先我们需要了解的是根目录下的配置文件_config.yml和主题目录下的配置文件_config.yml根目录配置文件详解site:网站个性化描述# Siteti...
2019-10-26 17:19:49
410
原创 Hexo+阿里云服务器搭建属于自己的博客
搭建博客方式有很多种,其中hexo就是一款轻量、简易、高逼 格的博客制作工具,它是基于node.js的。hexo 正常来说,不需要部署到我们的服务器上,我们的服务器上保存的,其实是基于在hexo通过markdown编写的文章,然后hexo帮我们生成静态的html页面,然后,将生成的html上传到我们的服务器。简而言之:hexo是个静态页面生成、上传的工具。本文参考了b站的一位大佬的视频,区别就在...
2019-10-25 22:28:25
2084
4
转载 数组
1、数组的声明数组的声明有两种方式:一种是使用array()函数声明数组,另一种是直接通过为数组元素赋值的方式声明。array()函数声明方式如下:array array([mixed ...])参数mixed的语法为key=&amp;amp;gt;value,多个参数mixed间用都好分开,分别定义索引和值。索引可以是字符串或者数字。如果省略索引,则会自动产生0开始的整数索引,下一位则是目前最大索引+1...
2019-02-01 16:59:04
534
转载 字符串操作
1、字符串简介由零个或多个字符构成的一个集合,自负主要包含:数字类型:1、2、3等。字母类型:a、b、c等。特殊字符:#、$、%、^、&amp;等。不可见字符:\n(换行)、\r(回车)、\t(Tab)等。不可见字符较为特殊,用于控制字符串格式化,只能看到字符串输出结果。&lt;?php echo "friut\rpear\napple\tbanana";?&gt;2、单引号...
2019-01-30 15:39:59
343
转载 PHP流程控制语句
1、条件控制语句if语句:几乎所有语言都包括if语句。格式为:if(expr) statement;如果表达式expr的值是真值则运行statement,否则跳出该语句。若有多条statement时,需要用{}括起来。<?php $num = rand(1,31); if ($num%2==0) { echo "\$num = $num"; echo "<br&...
2019-01-25 16:27:42
1888
转载 PHP语言基础(五)----函数
1、函数的定义和调用function fun_name($str1, $str2,...$strn){ fun_body;}function:自定义函数时必须用到的关键字。fun_name:自定义函数的名字。$str1, $str2,...$strn:函数的参数。fun_body:函数的主体,功能实现部分。调用函数时,只需要调用函数名,并加上合适的参数即可。<?php...
2019-01-24 15:26:42
726
2
转载 PHP语言基础(四)----运算符
1、算数运算符加法运算符+减法运算符-乘法运算符*除法运算符/取余运算符%递增运算符++递减运算符–取余运算时,若被除数是负数,结果也是负数。2、字符串运算符&lt;?php $n = "3.1415926r*r"; $m = 1; $nm = $n.$m; echo $nm."&lt;br&gt;";
2019-01-23 17:15:41
390
转载 PHP语言基础(三)----PHP变量
1、变量声明及使用程序执行过程中数值可以变化的量。通过名字来标识,系统会为其在内存中开辟空间,变量实质是计算机内存单元的命名。借助变量名访问内存数据。&amp;amp;lt;?php $string1 = &amp;quot;spcn&amp;amp;lt;br&amp;amp;gt;&amp;quot;;//直接定义一个变量后直接赋值。 $string2 = $string1;//变量间的赋值 $string1 =
2019-01-22 19:51:05
343
转载 PHP语言基础(二)----PHP变量
PHP常量1、定义和使用常量常量被定义后在脚本的任何位置都不能更改,一个常量由英文字母、下划线、数字组成。数字不能作为开头。PHP中使用==define(string constant_name, mixed value, case_sensitive=true)==函数来定义一个常量。三个函数值的含义:constant_name必选参数,常量名称,即标识符value...
2019-01-22 13:38:45
319
转载 PHP语言基础(一)
PHP的标记风格:1、XML风格:&amp;amp;amp;lt;?phpecho “这是XML风格标记”;?&amp;amp;amp;gt;特点:服务器不能禁用,在XML和XHTML中均可使用。2、脚本风格:&amp;amp;amp;lt;script language=”php”&amp;amp;amp;gt;echo “这是脚本风格标记”;&amp;amp;amp;lt;/script&
2019-01-21 15:45:05
8963
java IO习题
2018-12-20
计算机网络.docx
2019-10-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅