自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 处理dicom视频(将json视频标签转为单帧图像yolo标签)

由于我是使用pair进行标注,得到的目标检测框的标注格式是json文件,一个视频有200张左右的图像组成,所有的图片标注 即这个视频 的所有标签都存在同一个json文件里,我需要将这些标签都转为单张图片的yolo格式,所以要将图像和标签都统一一下命名格式。1.首先, 使用JSON文件中的 Width (800) 和 Height (600) 作为基准,计算出标准的、归一化到0-1之间的YOLO坐标。dicom的坐标跟体坐标有个换算关系,转换后的xyz都要除以spacing!

2025-12-01 11:01:10 401

原创 nnUNet训练自己的二维RGB数据集全过程#全网最详细!

在模型训练的每一步,数据加载器 (data loader) 都会从这个文件夹中读取对应的真实标签,并将其与模型的预测结果进行比较,然后计算损失函数 (loss),并反向传播更新模型的权重。5.关于数据维度:nnU-Net 的设计哲学就是自动适应您的数据特性,包括数据的维度。当您运行 nnUNetv2_plan_and_preprocess 时,框架会自动分析您的数据集并发现它是2D的,发现图像是2D的(只有X和Y维度,Z维度为1或者本身就是2D图像格式),然后会自动生成适用于2D数据的配置和计划。

2025-10-21 13:51:13 1279

原创 结构化数值型特征数据分类模型

③由于报告里的特征非常多,经过我导师还有超声科医生专业的筛选和数据清洗,最终选出11个数值型特征,用这11个数值型特征做一个二分类模型(二尖瓣重度关闭不全和二尖瓣中度关闭不全)。目前初步的构想是把这11个数值型特征,转化为一个一维向量,对向量进行分类;数据不多(本来挺多的,清洗完满足要求的就不多了),是不是更应该考虑机器学习呢?提取的数据特征如下:①初步提取结果,就是直接从报告中提取文字字母符号等。②进一步提取特征,将属性归类:分为12个数值型特征,29个描述型特征。我应该怎么处理这些数据呢?

2025-07-18 17:21:46 249

原创 提取心脏超声报告中的文本特征

本文介绍了基于超声心动图报告的瓣膜病分类模型构建方法。研究采用二尖瓣中重度关闭不全患者的超声报告数据,包含定量数值型特征(心脏测值)和非结构化文本特征(1-7描述型特征)。针对文本特征的复杂表述和大模型处理优势,研究提出使用NLP技术提取e列等混合特征。数据预处理包括:1)用search_and_copy_rpt.py提取患者报告;2)通过test_ocr.py从图片中提取心脏测值;3)使用data_matcher.py整合定量和定性数据。该方法能有效处理医疗文本的歧义和变体,支持临床决策。

2025-06-30 17:26:20 260

原创 学透FGVC项目(用于心脏超声图像训练37分类模型)

①首先用testpicture.py测试一下,先检测每张图片,因为医院数据有时候导出来的图片会存在问题,有可能读不出来;这段代码的主要功能是遍历指定文件夹及其子文件夹中的所有文件,检查文件名中是否包含中文字符,如果包含则删除该文件;以及打印出打不开的图像的路径。一般情况下,训练模型划分比例是8:2,如果是复核的话就是5:5,一半用于训练,一般用于预测;训练一次后再反过来,刚刚用于预测的拿来训练,拿来训练的用于预测。⑤get infer dataset是生成测试用的csv文件,和all.py的作用差不多。

2025-06-14 17:09:11 227

原创 学透MANIQA项目评分模型!(我用于评估心脏超声影像)

这段代码是一个完整的图像质量评估(IQA)模型训练和验证的流程,主要基于MANIQA模型(一种基于Transformer的IQA模型)①先用testpicture.py 和 deletesame.py对数据进行清洗;再用all.py对数据集进行划分。③再用 getinferdataset.py 生成预测数据集的csv文件。④然后使用inference.py对数据集进行预测评分,:将每个类别的图像按8:2比例随机划分为训练集和测试集。:数据集统计信息(类别名称、ID、数量分布)数据集在datasets下。

2025-06-10 11:29:35 220

原创 心脏超声图像五分类模型

all.py这个python文件创建了几个CSV文件:datasets_info.csv、train.csv和test.csv。然后跑main.py, 不知道为啥一直报错,一直说pretrained的参数有问题,我试过改成null,或者~都是报错。先把数据集划分好,然后去改yaml配置文件里的参数,比如数据集路径,batchsize,由于这次的数据集是五分类的,所以我将命名为从0到4.:记录每个视图类别的总图像数、训练集和测试集数量。:分别存储训练集和测试集的图像路径及其标签。如图所示,有五种类别。

2025-04-04 22:03:55 438

原创 心脏超声影像分类预测

记录自己训练心脏超声影像模型过程的遇到的一些问题和收获,希望能和大家一起交流进步

2025-03-25 19:16:48 473

原创 小白学Transformer模型#最全总结!

Transformer是基于编码器-解码器的架构来处理序列对,Transformer 的编码器和解码器是基于自注意力的模块叠加而成的,源(source,输入)序列和目标(target,输出)序列的嵌入(embedding)表示通过加上位置编码(positional encoding)加入位置信息,再分别输入到编码器和解码器中。, 两种注意力一起作用,使得进入动物眼中图像信息被过滤了、更好的选择性的去噪了,也就是信息被更好的压缩了, 有了这两种注意力,就能够极大的压缩信息,不需要在RNN的状态传递。

2025-01-08 17:08:09 973

原创 用Maniqa模型训练心脏超声图像

该模型旨在根据人类的主观感知来评估图像的感知质量,特别是在处理基于生成对抗网络(GAN)生成的失真图像时,能够提供准确的质量评分。- 应用场景:MANIQA 广泛适用于图像处理、视觉检测和人工智能领域的诸多场景,如图像压缩、去噪或增强算法的效果评估,以及生成对抗网络(GANs)训练后的结果质量判断。左图是我的代码文件和配置文件,右图为我的数据集,类型都是二尖瓣水平短轴切面,由于maniqa是评分模型,所以还需要评分的分数作为标签。对图像进行预处理,删除相同图像、有问题图像。Maniqa模型架构如上图所示。

2025-01-08 14:15:36 940

原创 2.Python深度学习

5.将参数沿着梯度的反方向移动一小步,比如 w= learning_rate * gradient,从而使得这批数据上的损失值减小一些。(mini-batch stochastic gradient descent 简称小批量SGD)3.计算模型在这批数据上的损失值,用于衡量y_pred和y_true之间的差距。2.在x上运行模型,得到预测值y_pred,这一步叫作前向传播。1.抽取训练样本x和对应目标y_true组成的一个数据批量。4.计算损失相对于模型参数的梯度。是指每批数据都是随机抽取的。

2025-01-02 15:35:11 387

原创 1.Python深度学习

计算机有效工作的常用方法是:由人类程序员编写规则,计算机遵循这些规则将输入数据转换为适当的答案。但机器学习是把这个过程反过来:机器读取输入数据和相应的答案,然后找出应有的规则,机器学习系统是训练出来的。通过以下两步来寻找决策边界:1.将数据映射到新的高维表示;2.尽量让超平面与每个类别最近的数据点之间的距离最大化,从而计算出良好的决策边界.:将损失值作为反馈信号,来对权重值进行微调,以降低当前示例对应的损失值。:首先构建许多专门的决策树,然后将它们的输出集成在一起。:手动为数据设计良好的表示层。

2024-12-27 12:58:44 277 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除