- 博客(92)
- 收藏
- 关注
原创 AI面试速记
回答:回答:检查方式:PYTHONPyTorch 要求参与同一运算的张量必须在相同设备上。当你执行 时,本质是:PYTHON如果 在 GPU,而 在 CPU,就会报错:TEXT回答::启用 训练模式:启用 评估/推理模式回答:对一个 batch 中的每个通道(channel),进行如下操作:BatchNorm 的作用对象是:对每个通道 ,独立地对该通道在所有样本(B)和空间位置(H×W)上做归一化。也就是说,每个通道有自己的 、、、。回答:回答:在不需要计算梯度的场景下使用,例如:好处:回答:回答:
2025-11-15 22:38:47
576
1
原创 CT重建算法
想象你用手电筒从不同角度照射一个不透明的物体(比如一个苹果),在对面墙上会得到一系列。(常用 Ram-Lak、Shepp-Logan、Hamming 等滤波器)需要完整、均匀的投影数据;对每个角度的投影数据 p(θ,s)p(θ,s) 做。:计算快(O(N² log N)),适合临床实时重建。:抗噪强、可用更少投影(如低剂量CT)、减少金属伪影。:计算慢(分钟级 vs FBP的秒级);:重建质量高、速度快(GPU推理)、可学习复杂先验。:横轴是探测器位置 ss,纵轴是旋转角度 θθ。,高效、快速、理论成熟。
2025-11-14 16:57:09
993
原创 Large-Scale 3D Medical Image Pre-training with Geometric Context Priors
—标注数据的稀缺性给医学图像分析带来了重大挑战,尤其对于高维的三维医学图像而言,获取标注需要放射科医生投入大量精力。大规模预训练作为一种有望实现标签高效利用的解决方案,凭借对大规模数据、大模型和先进预训练技术的整合,展现出巨大潜力。然而,其在医学图像领域的应用仍处于初步探索阶段。主要挑战在于如何有效利用大规模无标注数据,在缺乏人工标注的情况下学习高层次语义信息。我们观察到,三维医学图像具有稳定的几何上下文特性,即不同器官之间存在一致的几何关系,这为学习一致性的表征提供了可行路径。
2025-11-01 00:18:48
651
原创 MONAI:PersistentDataset
用于持久化存储预计算结果,以高效管理大于内存容量的字典格式数据。该数据集可对特定字段执行变换操作。的变换),并对其进行哈希。系统会在遇到第一个非确定性变换或非 MONAI。设置新的输入数据,并删除所有过期的缓存内容。,对于基于文件名的数据集,系统会依次执行。方法更新输入数据并重新计算缓存内容。获取可哈希的变换(即确定性且继承自。),将返回一个 PyTorch 的。读取预处理结果,然后仅执行变换中。在训练过程中,可通过调用。如果传入切片索引(如。
2025-10-16 16:35:15
387
原创 VOCO摘要
自监督学习(Self-Supervised Learning, SSL)在3D医学图像分析中已展现出良好的效果。然而,预训练阶段缺乏高层语义信息,严重制约了下游任务的性能。我们观察到,3D医学图像中包含相对一致的上下文位置信息,即不同器官之间具有稳定的几何关系,这为我们提供了一种在预训练阶段学习一致语义表示的潜在途径。本文提出了一种。
2025-10-07 23:11:20
773
原创 VOCO代码梳理
在VoCo框架中:- __学生网络__是主要的学习者,负责学习上下文位置预测任务,直接参与所有损失函数的计算和梯度更新- __教师网络__通过EMA机制提供稳定的目标特征表示,在对比学习中作为参考标准,但不直接参与梯度更新- 这种设计使得模型能够更稳定地学习到有意义的特征表示,同时通过双向对比机制增强了学习效果。
2025-10-02 16:03:06
687
原创 自监督学习分割
体素(voxel)是“体积像素(volume pixel)”的简称,是三维空间中的最小数据单元,类似于二维图像中的“像素(pixel)”。一个三维体素块可以表示为一个形状为或(D, H, W)的立方体数据块,有时还带通道维度,如,其中 C 是通道数(例如单通道CT、多模态MRI等)。举例:一个输入块可能是的体素块,代表一个局部的三维解剖区域。3D CNN 的输入确实是三维体素块,不是二维切面。它通过三维卷积操作,直接在体数据上提取空间特征,更适合医学图像中复杂的三维解剖结构分割任务。
2025-09-18 23:25:24
276
原创 可微分3D高斯溅射(3DGS)在医学图像三维重建中的应用
WebGPU渲染管线集成Mip-Splatting → 支持AR/VR解剖教学。新视角合成帧率 ≥30 FPS(桌面端)、≥10 FPS(移动端)获取HiP-CT/CTA数据 → 降采样至50μm级 → 8位量化。扩展Alpha优化 → 敏感度感知VQ压缩 → 生成HR/HQ模型。的医学体积数据三维重建,支持移动端/网页端交互式解剖学习。:代理模型(高斯过程) + 采集函数(上置信界,κ=10)将GB级医学影像(CT/MRI)压缩至MB级可渲染表示。下的多角度解剖结构探索(如器官、血管)
2025-07-16 00:07:11
874
1
原创 CA问题随笔
医学数据的高动态范围(如CT值差异)进一步增加采样需求。:解剖结构的复杂性使“跳过空白区域”的优化效果有限,多数光线仍需遍历密集体素。:手机GPU(如Adreno 740)速度慢100倍以上,单帧需分钟级计算。每条光线需模拟数十至数百次随机相互作用,计算量随路径长度指数级增长。:高端GPU(如NVIDIA A100)渲染单帧1080p医学图像需。:次表面散射(皮肤、黏膜)需额外光线追踪,计算成本翻倍。,计算复杂度从指数级降至线性,使移动端实时渲染成为可能。:光线在参与性介质(如人体组织、云雾)中会经历。
2025-07-15 22:28:07
391
原创 Application of 3D Gaussian Splatting for Cinematic Anatomy on Consumer Class Devices
1.搜索效率革新•BOS 将相机位姿选择复杂度从 $O(N^2)$ 降至 $O(N\log N)$•采样量减少 40-60% 仍达同等精度2.物理建模突破•透射率驱动的连续可见性模型de−σtsds•解决二值模型在部分遮挡场景的失效问题3.工程优化•GPU-CPU 混合计算架构:•实时光线步进(GPU)•低分辨率后备方案(CPU)3.2 图像生成Monte Carlo Volume Path Tracing(蒙特卡洛体积路径追踪)
2025-07-14 22:13:48
476
原创 CV面试题总结
聚类(Clustering)是一种无监督学习方法,目标是把样本按照相似性自动划分为若干组(簇,cluster)。同一簇内的样本应当“相似度高”,不同簇之间应当“相似度低”。输入:仅有特征向量,没有任何人为标签。输出:每个样本所属的簇编号或簇中心,以及簇内成员列表。本质:在特征空间中发现数据的内在结构或分布模式。按“划分方式”大致分为四类:原型-划分、层次、密度、图或概率模型。类别代表算法核心思想典型优缺点原型-划分K-Means迭代寻找k个中心,使簇内平方误差(或绝对误差)最小简单高效;
2025-07-03 00:43:12
1060
原创 Python八股文
Python的内存管理机制主要包含三个方面:对象分配与回收、内存池机制以及垃圾回收机制。对象分配与回收Python中一切皆对象,每个对象都有自己的内存空间。当创建一个对象时,Python解释器会根据对象的类型和大小,在内存中分配相应的空间。a = 10此时,Python会在内存中为整数对象10分配空间,并让变量a指向这个对象。当对象不再被引用时,Python会回收该对象所占用的内存。a = 10b = aa = 20 # 此时对象10的引用计数减1。
2025-07-02 01:12:15
972
原创 3dgs涉及的基本概念:球谐系数(SH 系数)等
• 在 3DGS 里,我们常需要同时存储一大批高斯分布的各项参数,比如“形状参数”(协方差矩阵相关信息)和“球谐系数”(或其他外观参数)。• 直观地说,这些系数描述了该函数在每个球谐基函数上的“权重”或“贡献”大小,从而实现用有限个基函数近似一个更复杂的球面分布。• 当我们把一个球面上的函数(例如一个光照分布或者视角相关的颜色函数)展开到球谐基底上时,就能得到一系列的球谐系数。• 将每个要压缩的向量近似匹配到码本中最相似的那个向量(称为码字),只需记录它所匹配的“码字索引”而非原向量本身。
2025-06-22 18:17:09
1126
原创 Cargo 与 Rust 项目
npyz = { version = "0.8", features = ["npz"] } # 带特性。edition = "2021" # Rust 版本。cc = "1.0" # 编译C代码用。serde = "1.0" # 精确版本。mockall = "0.12" # 仅测试用。├── Cargo.toml # 项目配置中枢。├── Cargo.lock # 依赖版本锁。
2025-06-20 23:50:29
835
原创 VTK数据尺寸调整(spacing)的问题
如果只是单独改一下 SetOutputSpacing 而没有合适的变换矩阵,默认还是把原始体素一对一映射进去,最终只是更新了 metadata(Spacing),并没有真正“插值”或“拉伸/压缩”数据。如果 spacing 改变只是停留在 metadata 层面,而 data extent、方向矩阵或插值采样没有同步更新,渲染结果就不见得会像“手动改变数组维度”那样产生直观的形变变化。:只影响重采样后的数据表示,不影响渲染器的空间坐标系。:影响整个渲染管线的空间坐标系。:改变图像的重采样行为。
2025-06-16 21:39:25
583
原创 背包问题(动态规划)
对应的选法是:物品 2(w=2, v=4)和物品 3(w=3, v=5),或物品 1(w=2, v=3)+ 2(w=2, v=4)时价值为 7,不如 (2,3) 的组合。dp[i][j] = max( dp[i-1][j], dp[i-1][j - w_i] + v_i ) (如果 j ≥ w_i)dp[i][0] = 0,表示背包容量为 0 时,无法放任何物品,价值为 0。• dp[0][0..5] = 0(当没有物品时,无论容量多少,价值都为 0)同时给定一个背包的最大容量(或最大重量)W。
2025-06-16 20:10:05
690
原创 cinematic-gaussians
train.py主训练脚本,负责模型的训练过程,包括数据加载、模型初始化、优化器设置、训练循环、日志记录和模型保存。包含项目的文档和静态资源。包含一些外部依赖的子模块,如差分高斯光栅化和简单的 KNN 实现。数据加载由模块完成,主要通过是项目的核心模型,定义在中。它使用高斯分布来表示场景中的点云,并支持 3D 渲染和优化。定义在中,用于更新高斯模型的参数。它支持学习率调整和梯度更新。函数定义在中,用于将高斯模型渲染为图像。它支持背景颜色设置和分辨率调整。使用从命令行解析训练参数,并通过。
2025-06-13 17:39:17
965
原创 CloudReadering
这段代码实现了一个功能全面的传输函数管理系统,集成了数据管理、插值计算、文件操作和用户界面。它适用于需要动态调整颜色和透明度映射的应用场景,如科学可视化或图形渲染。
2025-06-10 14:36:05
594
原创 vpt_denoise
功能点 | 实现方式 | |----------------------|--------------------------------------------------------------------------| || 功能点 | 实现方式 | |----------------------|--------------------------------------------------------------------------| |中计算能量场,用于贝叶斯优化的目标函数 | |
2025-05-27 17:34:55
1071
原创 DRL-PathTracing: F-1和F-2,正距离场(EDT),快速行进距离场(GDT)
F-1和F-2:定义了路径追踪的起点和终点。正距离场(EDT):提供了图像中每个体素到最近边界的欧几里得距离,帮助代理判断距离边界的位置。快速行进距离场(GDT):通过模拟波从初始点传播的过程,提供了从初始点到图像中每个点的距离信息,帮助代理进行高效的路径追踪。这些距离场在代理的训练过程中起到关键作用,通过结合这些距离信息,代理能够更好地规划路径并优化其移动策略。
2025-05-27 00:57:55
960
原创 Ray Tracing(光线追踪)与 Ray Casting(光线投射)
时间复杂度为O(N⋅R⋅DK),其中 D 是递归深度,K 是分支因子(如每次弹射生成多条光线)。:时间复杂度为O(N⋅R),其中 N 是光线数(像素数),R 是场景物体数。:确定像素对应的物体表面颜色,通常仅计算直接光照(如材质颜色或简单阴影)。:求解光线在场景中的多次弹射路径,最终累积所有光照贡献(直接光、间接光)。:一种从观察点(如摄像机)向场景中每个像素投射单条光线,找到。的一种实现方式 ,更适合复杂光照(如漫反射全局光照)。:一种递归追踪光线路径的算法,模拟光线与物体的。
2025-04-21 20:22:33
494
原创 B/S阅片项目算法梳理
VTK中视口的二维坐标系Y轴朝上,前端屏幕显示二维坐标系Y轴朝下(原点在左上角)所以,前端传入的Y坐标,和传给前端的Y坐标,要:视口高度 - Y坐标。进行Y轴的翻转。
2025-03-28 20:45:43
304
原创 Python:property装饰器的作用
特性说明属性化方法调用用替代,更符合直觉数据验证在 setter 中检查数据合法性(如类型、范围、格式)访问隔离外部不直接操作实际存储的_name,保护数据完整性动态计算属性getter 可以实时计算值(例如根据其他属性生成结果)接口兼容性后续修改_name的存储方式时,外部调用接口无需变更。
2025-02-21 16:57:46
236
原创 基于三维先验知识的自监督医学图像分割方法
显示表达是指将先验知识显式地编码到模型中。这通常涉及手工设计特征、规则或模型结构,以明确地告诉模型如何处理数据。例如,通过特征工程提取的特征、基于规则的系统、特定的模型结构等都属于显示表达。
2024-12-17 21:27:23
1302
原创 volumeMapper体绘制中投影设置
Composite 模式:适用于大多数体绘制场景,如医学影像(CT、MRI)。MIP 和 MinIP 模式MIP:显示高密度区域,适合骨骼或肿瘤检测。MinIP:显示低密度区域,适合肺部气体或血管成像。Additive 模式:用于总能量或整体密度分布的可视化,结果为灰度图。Average 模式:类似加法模式,但计算平均值,用于分析密度趋势。IsoSurface 模式:用于特定数据分布的精确显示,如解剖学等值面建模或工业仿真。
2024-12-03 11:23:15
695
原创 VTK中对于相机camera的设置
的核心属性有默认值。如果你不设置这些属性,相机会使用默认值来渲染场景。以下是 VTK 相机中常用方法的详细说明,包括作用、用法,以及。这些旋转会改变相机的位置和方向,但不会自动调整。这些方法用于旋转相机,调整相机的视线方向。旋转相机 -> 视觉效果上旋转三维vr图像。这些方法用于设置或调整相机的位置和焦点。
2024-11-27 17:34:43
2564
原创 B/S后端web开发:处理前端消息操作
用于定义一个 WebSocket 路由。将 mpi_socket 函数绑定到 /ws/getCompressedMprData 路径,处理 WebSocket 连接。#用于定义一个 HTTP 路由。将 reconstruct3D 函数绑定到 /reconstruct3D 路径,处理 GET 请求。
2024-11-18 18:07:10
534
原创 python中for循环通过手动更新:跳过i(拆分子序列)
会依次提供下一个索引和对应的元素。通过手动操作更新状态(如加入第 7 和第 8 张)并跳过循环中的部分逻辑后,循环是基于迭代器的,在 Python 中,
2024-11-18 18:05:07
505
原创 DICOM子文件夹区分依据是什么
每个序列可能代表不同的成像模式(如T1加权、T2加权、增强扫描等),或不同的扫描参数(如不同的层厚、不同的扫描方向等)。:有时,原始扫描数据会被后处理生成不同的重建图像(如MPR重建、MIP重建等),这些重建图像也可能会被存储在不同的子文件夹中。:在动态增强扫描(如CT或MRI的多时相扫描)中,不同的时相(如动脉期、静脉期、延迟期等)通常会被保存为不同的子文件夹。:如果同一个患者在不同的扫描设备上进行了成像,或者使用了不同的扫描协议,这些图像文件可能会被分配到不同的子文件夹。
2024-11-05 16:20:26
497
原创 在三维空间中旋转向量时的,旋转方向
在三维空间中旋转向量时,旋转的方向由定义的旋转轴和旋转角度决定。根据数学约定,通常遵循右手定则来确定旋转方向。
2024-10-16 19:52:49
642
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅