自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 具有区域引导参考和基础的大型语言模型,用于生成 CT 报告

自动生成CT报告——要求对每个解剖区域进行详细分析从整个图像中提取全局特征——>忽略了CT作为三维成像方式的固有多样性吗,仅使用图像级嵌入来捕捉区域特异性异常对解码器来说是一个巨大挑战——>增强模型处理和整合区域特异性信息的能力,对于生成全面且临床相关的CT报告至关重要。通用分割模型——零样本分割能力——从CT图像提取解剖掩码——生成关键区域信息——参考和定位:参考侧重于理解图像中指定区域的语义并提供描述;而定位则根据文本信息定位特定区域,实现语言与视觉元素的连接。

2025-09-10 17:02:40 818

原创 基于Grad-CAM(Gradient-weighted Class Activation Mapping)的可解释性分析

类别c的logit:yc(这个是什么:是模型对类别c的原始打分,还没有经过softmax和sigmoid的数值,一个样本对每个类别都会计算出一个值);,厚层聚合了大量前层证据,学到的往往是高级形态(核形、颗粒、核染色、Auer小体等),更贴近临床语言,早层只会告诉你“这里有条纹/对比度高”;而对没有空间维的模型(RNN、MLP),则不合适。,随着层级的加深,感受野逐渐增大,最后几层的感受野已经足够覆盖整个细胞或其关键结构,而不是零碎纹理;最后一层卷积的第k个通道特征图Ak,H*W维(这里要计算所有通道);

2025-09-07 16:01:25 200

原创 Completed Feature Disentanglement Learning for Multimodal MRIs Analysis

MoE训练多位专家从输入中提取不同的表示空间,并使用门控网络生成相应的权重, 能够动态地捕获来自多位专家的混合信息,然而,这些方法将所有输入连接起来以生成门控网络中的权重,而没有充分考虑不同输入之间的关系,这可能会限制融合过程的有效性。为了提高特征融合的可解释性,提出了一种新的动态混合专家融合 (DMF) 模块,它可以明确捕捉解耦特征之间的局部-全局相互关系,以实现更有效的融合。通过共享编码器解耦共享特征,通过私有编码器解耦特有特征,最终的模态共享特征是所有模态共享特征的平均值。

2025-08-19 14:49:03 815

原创 Table Foundation Models: on knowledge pre-training for tabular learning(每日一文)

研究现状及问题本文我们介绍 TARTE,这是一个基础模型,它使用字符串来捕获语义,将表格转换为知识增强的向量表示。TARTE 已基于大型关系数据进行预训练,其生成的表示有助于后续学习,且几乎无需额外成本。这些表示可以进行微调或与其他学习器结合使用,从而形成能够提升最佳预测性能并改善预测/计算性能平衡的模型。TARTE 专注于特定任务或领域,提供特定领域的表征,以促进进一步学习。我们的研究展示了一种有效的表格学习知识预训练方法。研究现状及问题。

2025-08-12 09:29:29 976

原创 快速准确的千兆像素病理图像分类,采用分层蒸馏多实例学习(每日一文)

预设实例留存率的影响:

2025-08-06 18:23:35 838

原创 用于肺癌生物标志物检测的微调病理基础模型的实际部署(每日一文)

编码器通过prov-gigapath初始化,即加载gigapath预训练参数做预热,再使用并行化策略(这里指的是训练时候将patches分摊到多块GPU上进行编码)对完整模型进行端到端训练,实现对gigapath的微调。快速检测(如 PCR)只能检测一小部分常见 EGFR 突变,而 NGS(下一代测序)可以全面检测所有可能的突变,甚至包括其他基因,支持更精准、更全面的治疗决策。在研究方法上,肺活检样本体积小、组织有限,但一个病人的诊断往往需要多个组织检测(H&E、IHC、快速 PCR、NGS 等);

2025-08-05 22:50:25 1280

原创 Mixture-of-Recursions: Learning Dynamic Recursive Depths for Adaptive Token-Level Computation(每日一文)

自然语言处理大语言模型高效推理与训练系统边缘部署与低资源场景。

2025-08-03 19:58:31 967

原创 LSNet: See Large, Focus Small(每日一文)

采用大核瓶颈块设计,给定特征图X,受限通过驻点卷积将token投影到低维通道,以降低计算量(默认是C/2,即通道数除以2),然后使用核大小为KLxKL的大核深度卷积高效捕获大感受野的空间上下文信息Nkl,再通过逐点卷积建模token之间的空间关系,生成用于聚合的上下文自适应权重W。此外,由P建模的token关系(聚合权重)仅依赖相对位置,对所有token共享且固定,缺乏对上下文变化的适应性,限制了轻量网络的表达能力。可以看出,P和A在信息较少的区域回引入冗余的注意力与过度聚合,限制了轻量模型的有效性。

2025-08-02 18:17:20 1028

原创 Aligning knowledge concepts to whole slide images for precise histopathology image analysis

主要是通过这个来异化两种概念特征的特异性,因为专家概念之间的语义本来就已经比较异质,即使不提这个损失,他们之间的相似度本来就不高;这里的F的形状是1xd。这里bag级别的C形状是1xd,表示的是类别整体的语义描述,ins级别的C形状是mxd,表示ins级别的提示是由m个构成的。表示 Softmax 函数的温度,控制了图像表示与类别概念之间相似度 softmax 的敏感度,从而影响模型分类的置信度分布与学习稳定性,温度越高,模型更不确定,多个类别评分都比较接近,温度更小,模型更偏向得分最高的类。

2025-07-14 10:48:56 952

原创 CVPR享用指南

IEEE/CVF 计算机视觉和模式识别会议 (CVPR) 是首屈一指的年度计算机视觉活动,由主会议和几个同地举办的研讨会和短期课程组成。凭借其高质量和低成本,它为学生、学者和行业研究人员提供了非凡的价值。Challenge/Demo/开源。Workshop 中的论文。Tutorial (教程)二、以多模态融合专题为例。

2025-06-19 16:04:07 1239

原创 Ubuntu指令学习

​:首先读取源文件的全部数据块,在目标位置创建新的文件,写入相同的数据。更新目标的元文件(权限,时间戳等),相当于重新抄写一本书的内容再放到另一个书架。适用情况:在某个文件夹下有许多小的文件夹,这些文件夹中存在一个后缀名相同的文件,现在我需要将这些文件提取出来,放在我的目标文件夹下。​,耗时几乎可以忽略不计。​(metadata),例如更新文件路径的目录条目(directory entry)。移动操作仅修改元数据(如文件名、路径、时间戳),不涉及数据块的物理移动。元数据操作在内存中完成,几乎瞬时生效。

2025-05-09 16:04:34 371

原创 大规模语言模型从理论到实践(一)

强化模型会使基础模型的熵降低,方法稳定性不高,超参数众多使得模型收敛难度大,再叠加RM模型的准确率问题,使得在大规模语言模型上如何能够有效应用强化学习非常困难。奖励建模阶段,构建一个文本质量对比模型,对于同一个提示词,SFT给出的不同输出结果进行质量排序,奖励模型(RM模型)可以通过一个二分类模型对输入的两个结果之间进行优劣的判断。缩放法则指出,模型的性能依赖于模型的规模,包括参数数量,数据集大小,计算量,模型的效果会随着三者的指数增加而线性提高。四个阶段:预训练,有监督微调,奖励模型,强化学习。

2025-05-07 14:33:18 327

原创 TCGA数据集下载

下载两个数据,一个sample sheet,一个是mainfest(这个文件结合gdc来下载数据)linux食用方法 工具下载好之后直接解压,在解压处输入指令即可开始下载。点击repository进入仓库,从左侧栏目中确定筛选条件。打开工具,导入mainfest文件,即可开始下载。-d out_directory用于指定输出文件。进入tcga官网时,不要用网页翻译,会出错。进入官网,点击感兴趣的组织部位。将选择的数据加入到购物车。点击CART进入下载页面。

2025-05-06 10:29:50 454

原创 LLM-driven multimodal target volume controuring in radiation oncology

通过LLM集成临床信息来调节分割模型。

2024-12-23 16:08:20 703

原创 Conslide:用于连续WSI分析的异步分层交互Transformer,具有Breakup-Reorganize排练功能

持续学习,能够克服静态模型学习的局限性并减轻灾难性遗忘,可以通过参数正则化、知识蒸馏、适当架构设计,或通过基于数据排练的策略来实现,但是通过排练的方法通过重放存储在内存缓冲区中的训练数据子集来获取良好的性能(什么意思),并且,WSI的特性对设计持续的WSI分析框架提出了独特的挑战。PT对每一个区域的patch集进行处理,学习不同patch特征之间的关系,然后计算输出特征,得到的输出特征的维度是(B,M,N,C)分别表示批量大小,区域数,区域内的补丁数,特征维度。持续学习可以由慢学习者和快学习者组成。

2024-12-18 09:25:18 1026

原创 一种基于多尺度信息和拒绝选项的新型骨髓细胞识别方法

一个可靠的协作识别算法需要能够自信地拒绝低置信度分类结果。

2024-12-17 10:18:20 1098

原创 SCkansformer:通过kansformer主干和分层注意力机制对骨髓细胞进行细粒度分类

4)扩展维度后,使用步长为1的3x3深度卷积获得特征图。为了使模型能够从多个角度并行关注输入图像序列,增强模型的表达能力和泛化能力,采用了MSA机制,MSA机制对每个输入图像执行多个注意力计算,这使得模型能够从不同位置的不同表示子空间中集体关注信息,捕获更加全面的和细粒度的全局语义信息。使用SCConv Encoder的主要优势在于,能够针对显微图像中的特定空间和通道冗余进行特征压缩,与传统的主要依赖统计方差进行特征缩减的计数不同,此方法再减少冗余信息的同时,特别擅长保留对准确分类至关重要的空间结构信息。

2024-11-28 18:48:58 759

原创 通过信息瓶颈增强多层实例学习对儿童白血病进行分类

第二步时通过关联矩阵将细粒度注意力矩阵转换为粗粒度矩阵,这个关联矩阵表示不同类别层次之间的关系,经过转换后,这个注意力矩阵中的每个元素同样表示对每个类别的重要性,这里两个注意力矩阵的不同点在于,两个对应类别的量是不同的,因为提取特征的层次不同,所以对应的分类也是不同的。首先使用卷积网络为骨干的编码器提取每个实例(即每个细胞)的特征,再分别使用两个全连接层提取粗粒度和细粒度特征(仅用于对应的分类任务),再使用一个全连接层提取提取层次共享特征(用于生成注意力矩阵,并参与两个粒度级别的分类任务)

2024-09-26 15:56:25 1086

原创 Ubuntu22.04配置深度学习环境

(开始之前,现在设置-电源中把休眠模式改一下,避免5分钟输一次密码)

2024-09-20 16:45:12 2077 1

原创 win安装linux系统(其实是纯linux安装)

安装完成后重启,发现无法进入图形界面,加载完成后,黑屏,左上角光标闪烁。系统启动盘制作完成后,插入主机,电脑重启,在电脑即将出现logo界面时,快速点按快捷键进入BIOS界面,(技嘉主板是del),进入bios后选择启动顺序,选择U盘2为第一启动顺序,选择后保存退出,进入到引导菜单(这里如果在一般开机时想要进入引导菜单栏,在开机时快速点按shift),选择Ubuntu(safe graphics),(我这里选择try or install ubuntu会黑屏,不知道怎么回事),然后就开始安装。

2024-09-17 13:34:29 1660

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除