- 博客(14)
- 收藏
- 关注
原创 《深度学习入门:基于Python的理论与实现》的内容概述
《深度学习入门:基于Python的理论与实现》是一本面向深度学习初学者的入门教程,旨在通过从零开始实现神经网络的过程,帮助读者理解深度学习的核心原理与技术。通过本书,读者不仅能掌握深度学习的基础知识,还能培养独立实现和调试模型的能力,为后续学习高级框架和应用奠定坚实基础。
2025-06-08 17:22:01
790
原创 学习进度总结
本文概述了深度学习与图像处理领域的学习目标与进度。主要目标包括掌握深度学习框架,构建基础组件并进行模型训练,以及利用深度学习分割方法实现病灶分割,并将其与CycleGAN框架融合优化。目前,学习者正在阅读《深度学习入门》(鱼书),已进展到第三章,并开始搭建CycleGAN模型,参考了GitHub上的开源代码。此外,关于病灶分割与CycleGAN及生成对抗网络的融合,学习者仍在研读相关论文。整体学习进度稳步推进,重点在于理论与实践的结合。
2025-05-17 17:19:47
309
原创 医学影像病灶检测与分割技术研究进展文献综述
医学影像病灶检测与分割技术正朝着智能化、多模态协同和轻量化方向发展。生成对抗网络与多尺度特征提取方法显著提升了分割精度,但模型复杂度与数据依赖性仍是主要瓶颈;多元信息融合技术通过弱监督策略降低数据需求,但跨模态对齐与计算效率问题亟待解决。当前研究趋势表明,结合物理约束与深度学习的混合模型、面向临床场景的轻量化部署方案将是未来突破重点。本团队拟从两方面开展创新:一是设计基于元学习的动态分割框架,通过在线适应提升小样本场景下的模型泛化能力;二是开发多模态融合的轻量化编码器,结合知识蒸馏技术实现高效部署。
2025-05-17 17:06:08
1328
原创 1. 数据操作
下面的例子分别演示了当我们沿行(轴-0,形状的第一个元素)和按列(轴-1,形状的第二个元素)连结两个矩阵时,会发生什么情况。我们可以看到,第一个输出张量的轴-0长度(6)是两个输入张量轴-0长度的总和(3 + 3);对于将两个数组作为输入的函数,按元素运算将二元运算符应用于两个数组中的每对位置对应的元素。这种机制的工作方式如下:首先,通过适当复制元素来扩展一个或两个数组,以便在转换之后,两个张量具有相同的形状。如果只想知道张量中元素的总数,即形状的所有元素乘积,可以检查它的大小(size)。
2025-05-11 20:55:13
1732
原创 了解CycleGAN框架
CycleGAN是一种无监督的图像到图像转换框架,能够在无需配对数据的情况下实现两个不同域之间的映射。其核心思想是通过对抗训练和循环一致性损失确保转换的合理性和可逆性。
2025-05-11 20:49:24
463
原创 01-安装
本节主要介绍安装MinicondaCPU环境下的Pytorch和其它课程所需软件包对于前面几节来说,CPU已经够用了。如果您已经安装了Miniconda/Anaconda, Pytorch框架和jupyter记事本, 您只需再安装d2l包,就可以跳过本节视频了开启深度学习之旅了;如果希望后续章节在GPU下跑深度学习, 可以新建环境安装CUDA版本的Pytorch。如果需要在Windows下安装CUDA和Pytorch(cuda版本),用本地GPU跑深度学习,可以参考李沐老师。
2025-05-11 20:45:19
2083
原创 了解生成对抗网络(GAN)
生成对抗网络(Generative Adversarial Networks,GANs)是一种由生成器(Generator)和判别器(Discriminator)组成的深度学习模型,通过对抗训练生成逼真的数据。
2025-04-27 18:02:23
394
原创 了解扩散模型
扩散模型(Diffusion Model)是一类基于概率的生成模型,通过模拟物理中的扩散过程(从有序到无序的随机扩散)来生成数据。近年来,它在图像生成、语音合成、分子设计等领域表现出色,成为深度学习领域的热门方向。
2025-04-27 17:59:12
596
原创 扩散模型在医学图像处理中的应用研究综述
扩散模型为医学图像处理提供了新的技术范式,其研究进展呈现三大特征:在生成任务中从单纯追求数量扩展转向质量优化,在分割任务中强调解剖结构感知,在应用层面逐步向临床辅助诊断延伸。现有文献表明,阶段融合策略(周朝阳,2024)、潜在空间多阶段训练(周朝阳,2024)与注意力引导模块(刘晓芳,2024)构成当前技术发展的三个支柱。然而,数据异质性适应能力弱、计算效率不足等问题制约着临床转化。本研究团队拟从两方面突破:一是构建包含多中心、多模态医学影像的联邦学习框架,通过分布式扩散模型训练提升泛化能力;
2025-04-27 17:48:21
1078
原创 了解多模态
多模态是指利用多种不同形式或感知渠道的信息进行表达、交流和理解的方式,通常包括视觉、听觉、文本、触觉等多种感官输入和输出方式。在计算机科学、人工智能和机器学习领域,多模态技术指的是通过整合来自不同模态的数据(如图像、文字、音频、视频等),从而增强模型的理解能力和推理能力。在自然语言处理和计算机视觉领域,多模态模型能够同时处理图像和文本任务,如图文描述生成、视觉问答等,帮助模型实现跨领域的理解和生成。多模态技术的核心在于通过融合或协调多种模态的信息,提升系统的性能、准确性和用户体验。
2025-04-17 20:28:10
600
原创 近期文献综述
值得关注的是,尹小龙(2020)基于磁共振影像构建的脑分区模型,通过融合功能连接图谱与解剖结构特征,实现了阿尔茨海默病早期阶段的分类准确率达89.7%。陈航(2022)的无源域自适应方法突破性地利用生成对抗网络实现跨机构数据迁移,在眼底图像分割任务中,无需目标域标注数据即可达到87.4%的IoU指标,验证了迁移学习在隐私保护场景下的应用价值。针对乳腺癌MRI分析中的模态异构问题,提出基于注意力门控机制的特征选择网络,通过动态加权融合DCEMRI与DWI序列的互补信息,分类准确率较单模态提升22.4%。
2025-04-16 21:42:37
580
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅