学無芷境-优快云博客

原创 AI面试速记

回答：回答：检查方式：PYTHONPyTorch 要求参与同一运算的张量必须在相同设备上。当你执行时，本质是：PYTHON如果在 GPU，而在 CPU，就会报错：TEXT回答：：启用训练模式：启用评估/推理模式回答：对一个 batch 中的每个通道（channel），进行如下操作：BatchNorm 的作用对象是：对每个通道，独立地对该通道在所有样本（B）和空间位置（H×W）上做归一化。也就是说，每个通道有自己的、、、。回答：回答：在不需要计算梯度的场景下使用，例如：好处：回答：回答：

2025-11-15 22:38:47 576 1

原创 CT重建算法

想象你用手电筒从不同角度照射一个不透明的物体（比如一个苹果），在对面墙上会得到一系列。（常用 Ram-Lak、Shepp-Logan、Hamming 等滤波器）需要完整、均匀的投影数据；对每个角度的投影数据 p(θ,s)p(θ,s) 做。：计算快（O(N² log N)），适合临床实时重建。：抗噪强、可用更少投影（如低剂量CT）、减少金属伪影。：计算慢（分钟级 vs FBP的秒级）；：重建质量高、速度快（GPU推理）、可学习复杂先验。：横轴是探测器位置 ss，纵轴是旋转角度 θθ。，高效、快速、理论成熟。

2025-11-14 16:57:09 993

原创 Large-Scale 3D Medical Image Pre-training with Geometric Context Priors

—标注数据的稀缺性给医学图像分析带来了重大挑战，尤其对于高维的三维医学图像而言，获取标注需要放射科医生投入大量精力。大规模预训练作为一种有望实现标签高效利用的解决方案，凭借对大规模数据、大模型和先进预训练技术的整合，展现出巨大潜力。然而，其在医学图像领域的应用仍处于初步探索阶段。主要挑战在于如何有效利用大规模无标注数据，在缺乏人工标注的情况下学习高层次语义信息。我们观察到，三维医学图像具有稳定的几何上下文特性，即不同器官之间存在一致的几何关系，这为学习一致性的表征提供了可行路径。

2025-11-01 00:18:48 651

原创 MONAI：PersistentDataset

用于持久化存储预计算结果，以高效管理大于内存容量的字典格式数据。该数据集可对特定字段执行变换操作。的变换），并对其进行哈希。系统会在遇到第一个非确定性变换或非 MONAI。设置新的输入数据，并删除所有过期的缓存内容。，对于基于文件名的数据集，系统会依次执行。方法更新输入数据并重新计算缓存内容。获取可哈希的变换（即确定性且继承自。），将返回一个 PyTorch 的。读取预处理结果，然后仅执行变换中。在训练过程中，可通过调用。如果传入切片索引（如。

2025-10-16 16:35:15 387

原创 VOCO摘要

自监督学习（Self-Supervised Learning, SSL）在3D医学图像分析中已展现出良好的效果。然而，预训练阶段缺乏高层语义信息，严重制约了下游任务的性能。我们观察到，3D医学图像中包含相对一致的上下文位置信息，即不同器官之间具有稳定的几何关系，这为我们提供了一种在预训练阶段学习一致语义表示的潜在途径。本文提出了一种。

2025-10-07 23:11:20 773

原创 VOCO代码梳理

在VoCo框架中：- __学生网络__是主要的学习者，负责学习上下文位置预测任务，直接参与所有损失函数的计算和梯度更新- __教师网络__通过EMA机制提供稳定的目标特征表示，在对比学习中作为参考标准，但不直接参与梯度更新- 这种设计使得模型能够更稳定地学习到有意义的特征表示，同时通过双向对比机制增强了学习效果。

2025-10-02 16:03:06 687

原创自监督学习分割

体素（voxel）是“体积像素（volume pixel）”的简称，是三维空间中的最小数据单元，类似于二维图像中的“像素（pixel）”。一个三维体素块可以表示为一个形状为或(D, H, W)的立方体数据块，有时还带通道维度，如，其中 C 是通道数（例如单通道CT、多模态MRI等）。举例：一个输入块可能是的体素块，代表一个局部的三维解剖区域。3D CNN 的输入确实是三维体素块，不是二维切面。它通过三维卷积操作，直接在体数据上提取空间特征，更适合医学图像中复杂的三维解剖结构分割任务。

2025-09-18 23:25:24 276

原创可微分3D高斯溅射（3DGS）在医学图像三维重建中的应用

WebGPU渲染管线集成Mip-Splatting → 支持AR/VR解剖教学。新视角合成帧率 ≥30 FPS（桌面端）、≥10 FPS（移动端）获取HiP-CT/CTA数据 → 降采样至50μm级 → 8位量化。扩展Alpha优化 → 敏感度感知VQ压缩 → 生成HR/HQ模型。的医学体积数据三维重建，支持移动端/网页端交互式解剖学习。：代理模型（高斯过程） + 采集函数（上置信界，κ=10）将GB级医学影像（CT/MRI）压缩至MB级可渲染表示。下的多角度解剖结构探索（如器官、血管）

2025-07-16 00:07:11 874 1

原创 CA问题随笔

医学数据的高动态范围（如CT值差异）进一步增加采样需求。：解剖结构的复杂性使“跳过空白区域”的优化效果有限，多数光线仍需遍历密集体素。：手机GPU（如Adreno 740）速度慢100倍以上，单帧需分钟级计算。每条光线需模拟数十至数百次随机相互作用，计算量随路径长度指数级增长。：高端GPU（如NVIDIA A100）渲染单帧1080p医学图像需。：次表面散射（皮肤、黏膜）需额外光线追踪，计算成本翻倍。，计算复杂度从指数级降至线性，使移动端实时渲染成为可能。：光线在参与性介质（如人体组织、云雾）中会经历。

2025-07-15 22:28:07 391

原创 CA翻译~

该段落介绍了。

2025-07-14 22:50:45 391

原创 Application of 3D Gaussian Splatting for Cinematic Anatomy on Consumer Class Devices

1.搜索效率革新•BOS 将相机位姿选择复杂度从 $O(N^2)$ 降至 $O(N\log N)$•采样量减少 40-60% 仍达同等精度2.物理建模突破•透射率驱动的连续可见性模型de−σtsds•解决二值模型在部分遮挡场景的失效问题3.工程优化•GPU-CPU 混合计算架构：•实时光线步进（GPU）•低分辨率后备方案（CPU）3.2 图像生成Monte Carlo Volume Path Tracing（蒙特卡洛体积路径追踪）

2025-07-14 22:13:48 476

原创 CV面试题总结

聚类（Clustering）是一种无监督学习方法，目标是把样本按照相似性自动划分为若干组（簇，cluster）。同一簇内的样本应当“相似度高”，不同簇之间应当“相似度低”。输入：仅有特征向量，没有任何人为标签。输出：每个样本所属的簇编号或簇中心，以及簇内成员列表。本质：在特征空间中发现数据的内在结构或分布模式。按“划分方式”大致分为四类：原型-划分、层次、密度、图或概率模型。类别代表算法核心思想典型优缺点原型-划分K-Means迭代寻找k个中心，使簇内平方误差（或绝对误差）最小简单高效；

2025-07-03 00:43:12 1060

原创 Python八股文

Python的内存管理机制主要包含三个方面：对象分配与回收、内存池机制以及垃圾回收机制。对象分配与回收Python中一切皆对象，每个对象都有自己的内存空间。当创建一个对象时，Python解释器会根据对象的类型和大小，在内存中分配相应的空间。a = 10此时，Python会在内存中为整数对象10分配空间，并让变量a指向这个对象。当对象不再被引用时，Python会回收该对象所占用的内存。a = 10b = aa = 20 # 此时对象10的引用计数减1。

2025-07-02 01:12:15 972

原创透视变换、仿射变换

6个（旋转+缩放+剪切+平移）：8个（比仿射多2个非线性参数）平行关系（平行线可能相交）线段比例（中点可能偏移）

2025-07-01 23:07:59 232

原创 3dgs涉及的基本概念：球谐系数（SH 系数）等

• 在 3DGS 里，我们常需要同时存储一大批高斯分布的各项参数，比如“形状参数”（协方差矩阵相关信息）和“球谐系数”（或其他外观参数）。• 直观地说，这些系数描述了该函数在每个球谐基函数上的“权重”或“贡献”大小，从而实现用有限个基函数近似一个更复杂的球面分布。• 当我们把一个球面上的函数（例如一个光照分布或者视角相关的颜色函数）展开到球谐基底上时，就能得到一系列的球谐系数。• 将每个要压缩的向量近似匹配到码本中最相似的那个向量（称为码字），只需记录它所匹配的“码字索引”而非原向量本身。

2025-06-22 18:17:09 1126

原创 Cargo 与 Rust 项目

npyz = { version = "0.8", features = ["npz"] } # 带特性。edition = "2021" # Rust 版本。cc = "1.0" # 编译C代码用。serde = "1.0" # 精确版本。mockall = "0.12" # 仅测试用。├── Cargo.toml # 项目配置中枢。├── Cargo.lock # 依赖版本锁。

2025-06-20 23:50:29 835

原创 Web Splats

基础方向性光照（漫反射效果）：精细镜面反射（如金属光泽）：平面着色，无方向变化。

2025-06-20 23:38:12 486

原创 VTK数据尺寸调整（spacing）的问题

如果只是单独改一下 SetOutputSpacing 而没有合适的变换矩阵，默认还是把原始体素一对一映射进去，最终只是更新了 metadata（Spacing），并没有真正“插值”或“拉伸/压缩”数据。如果 spacing 改变只是停留在 metadata 层面，而 data extent、方向矩阵或插值采样没有同步更新，渲染结果就不见得会像“手动改变数组维度”那样产生直观的形变变化。：只影响重采样后的数据表示，不影响渲染器的空间坐标系。：影响整个渲染管线的空间坐标系。：改变图像的重采样行为。

2025-06-16 21:39:25 583

原创背包问题（动态规划）

对应的选法是：物品 2（w=2, v=4）和物品 3（w=3, v=5），或物品 1（w=2, v=3）+ 2（w=2, v=4）时价值为 7，不如 (2,3) 的组合。dp[i][j] = max( dp[i-1][j], dp[i-1][j - w_i] + v_i ) (如果 j ≥ w_i)dp[i][0] = 0，表示背包容量为 0 时，无法放任何物品，价值为 0。• dp[0][0..5] = 0（当没有物品时，无论容量多少，价值都为 0）同时给定一个背包的最大容量（或最大重量）W。

2025-06-16 20:10:05 690

原创 cinematic-gaussians

train.py主训练脚本，负责模型的训练过程，包括数据加载、模型初始化、优化器设置、训练循环、日志记录和模型保存。包含项目的文档和静态资源。包含一些外部依赖的子模块，如差分高斯光栅化和简单的 KNN 实现。数据加载由模块完成，主要通过是项目的核心模型，定义在中。它使用高斯分布来表示场景中的点云，并支持 3D 渲染和优化。定义在中，用于更新高斯模型的参数。它支持学习率调整和梯度更新。函数定义在中，用于将高斯模型渲染为图像。它支持背景颜色设置和分辨率调整。使用从命令行解析训练参数，并通过。

2025-06-13 17:39:17 965

原创 CloudReadering

这段代码实现了一个功能全面的传输函数管理系统，集成了数据管理、插值计算、文件操作和用户界面。它适用于需要动态调整颜色和透明度映射的应用场景，如科学可视化或图形渲染。

2025-06-10 14:36:05 594

原创 vpt_denoise

功能点 | 实现方式 | |----------------------|--------------------------------------------------------------------------| || 功能点 | 实现方式 | |----------------------|--------------------------------------------------------------------------| |中计算能量场，用于贝叶斯优化的目标函数 | |

2025-05-27 17:34:55 1071

原创 DRL-PathTracing: F-1和F-2，正距离场（EDT），快速行进距离场（GDT）

F-1和F-2：定义了路径追踪的起点和终点。正距离场（EDT）：提供了图像中每个体素到最近边界的欧几里得距离，帮助代理判断距离边界的位置。快速行进距离场（GDT）：通过模拟波从初始点传播的过程，提供了从初始点到图像中每个点的距离信息，帮助代理进行高效的路径追踪。这些距离场在代理的训练过程中起到关键作用，通过结合这些距离信息，代理能够更好地规划路径并优化其移动策略。

2025-05-27 00:57:55 960

原创 Ray Tracing（光线追踪）与 Ray Casting（光线投射）

时间复杂度为O(N⋅R⋅DK)，其中 D 是递归深度，K 是分支因子（如每次弹射生成多条光线）。：时间复杂度为O(N⋅R)，其中 N 是光线数（像素数），R 是场景物体数。：确定像素对应的物体表面颜色，通常仅计算直接光照（如材质颜色或简单阴影）。：求解光线在场景中的多次弹射路径，最终累积所有光照贡献（直接光、间接光）。：一种从观察点（如摄像机）向场景中每个像素投射单条光线，找到。的一种实现方式，更适合复杂光照（如漫反射全局光照）。：一种递归追踪光线路径的算法，模拟光线与物体的。

2025-04-21 20:22:33 494

原创 C++代码里的“箭头”：-＞是什么意思

当有一个指向结构体或类的指针时，用。

2025-04-17 17:58:10 453

原创 B/S阅片项目算法梳理

VTK中视口的二维坐标系Y轴朝上，前端屏幕显示二维坐标系Y轴朝下（原点在左上角）所以，前端传入的Y坐标，和传给前端的Y坐标，要：视口高度 - Y坐标。进行Y轴的翻转。

2025-03-28 20:45:43 304

原创差分数组的定义与操作

（索引1到5），对区间。

2025-02-26 17:40:06 112

原创 Python：property装饰器的作用

特性说明属性化方法调用用替代，更符合直觉数据验证在 setter 中检查数据合法性（如类型、范围、格式）访问隔离外部不直接操作实际存储的_name，保护数据完整性动态计算属性getter 可以实时计算值（例如根据其他属性生成结果）接口兼容性后续修改_name的存储方式时，外部调用接口无需变更。

2025-02-21 16:57:46 236

原创 Python 多进程与多线程

Python 多进程与多线程

2025-02-21 16:49:56 252

原创 python：多重继承、MRO（方法解析顺序）

在。

2025-02-20 21:39:33 338

原创 python面向对象：方法

实例方法用于操作实例变量，必须包含。

2025-02-20 20:23:43 264

原创基于三维先验知识的自监督医学图像分割方法

显示表达是指将先验知识显式地编码到模型中。这通常涉及手工设计特征、规则或模型结构，以明确地告诉模型如何处理数据。例如，通过特征工程提取的特征、基于规则的系统、特定的模型结构等都属于显示表达。

2024-12-17 21:27:23 1302

原创 volumeMapper体绘制中投影设置

Composite 模式：适用于大多数体绘制场景，如医学影像（CT、MRI）。MIP 和 MinIP 模式MIP：显示高密度区域，适合骨骼或肿瘤检测。MinIP：显示低密度区域，适合肺部气体或血管成像。Additive 模式：用于总能量或整体密度分布的可视化，结果为灰度图。Average 模式：类似加法模式，但计算平均值，用于分析密度趋势。IsoSurface 模式：用于特定数据分布的精确显示，如解剖学等值面建模或工业仿真。

2024-12-03 11:23:15 695

原创 VTK中对于相机camera的设置

的核心属性有默认值。如果你不设置这些属性，相机会使用默认值来渲染场景。以下是 VTK 相机中常用方法的详细说明，包括作用、用法，以及。这些旋转会改变相机的位置和方向，但不会自动调整。这些方法用于旋转相机，调整相机的视线方向。旋转相机 -> 视觉效果上旋转三维vr图像。这些方法用于设置或调整相机的位置和焦点。

2024-11-27 17:34:43 2564

原创 B/S后端web开发：处理前端消息操作

用于定义一个 WebSocket 路由。将 mpi_socket 函数绑定到 /ws/getCompressedMprData 路径，处理 WebSocket 连接。#用于定义一个 HTTP 路由。将 reconstruct3D 函数绑定到 /reconstruct3D 路径，处理 GET 请求。

2024-11-18 18:07:10 534

原创 python中for循环通过手动更新：跳过i（拆分子序列）

会依次提供下一个索引和对应的元素。通过手动操作更新状态（如加入第 7 和第 8 张）并跳过循环中的部分逻辑后，循环是基于迭代器的，在 Python 中，

2024-11-18 18:05:07 505

原创按文件名从小到大顺序读取文件（.DCM）

【代码】按文件名从小到大顺序读取文件（.DCM）

2024-11-15 15:29:58 402

原创 DICOM子文件夹区分依据是什么

每个序列可能代表不同的成像模式（如T1加权、T2加权、增强扫描等），或不同的扫描参数（如不同的层厚、不同的扫描方向等）。：有时，原始扫描数据会被后处理生成不同的重建图像（如MPR重建、MIP重建等），这些重建图像也可能会被存储在不同的子文件夹中。：在动态增强扫描（如CT或MRI的多时相扫描）中，不同的时相（如动脉期、静脉期、延迟期等）通常会被保存为不同的子文件夹。：如果同一个患者在不同的扫描设备上进行了成像，或者使用了不同的扫描协议，这些图像文件可能会被分配到不同的子文件夹。

2024-11-05 16:20:26 497

原创方向向量绕三维坐标系旋转（x,y,z）

【代码】方向向量绕三维坐标系旋转（x,y,z）

2024-10-21 11:18:00 299

原创在三维空间中旋转向量时的，旋转方向

在三维空间中旋转向量时，旋转的方向由定义的旋转轴和旋转角度决定。根据数学约定，通常遵循右手定则来确定旋转方向。

2024-10-16 19:52:49 642

SlicerVisualizationTutorial

空空如也