德林恩宝-优快云博客

原创光场中的核心概念：Macro Pixel与SAI的深度解析与实例应用

例如，在Lytro光场相机中，一个宏像素可能包含5×5个子像素，每个子像素对应不同角度的光线。设光场数据为 ( L(u,v,s,t) )，其中 ((u,v)) 为角度坐标，((s,t)) 为空间坐标。生成SAI时，固定角度维度((u,v))，遍历空间维度((s,t))，提取对应子像素值，最终形成2D图像矩阵。例如，提取所有宏像素中同一位置的子像素（如左上角子像素），并按空间位置拼接，即可得到一个SAI。此案例展示了SAI的核心价值：通过角度信息的互补性，突破硬件限制，提升图像质量。

2025-03-16 21:10:22 954

原创理解光场模型：uv与st的结合

光场模型描述了一种四维空间，其中每个点都包含了光波的方向和强度信息。这种表示允许我们生成不同视角的图像，从而提供沉浸式的视觉体验。通过对光场的有效采样，我们能够在虚拟环境和真实场景中再现物体的外观和行为。

2025-03-16 20:30:33 412

原创均匀采样与低差异序列：从 Halton 到 Hammersley 到球面采样

Halton 序列是一种低差异序列，通常用于生成多维空间中均匀分布的采样点。与伪随机采样不同，Halton 序列在采样过程中能够避免点的堆积现象，使得生成的点更加均匀。生成 Halton 序列的核心是基数逆序小数给定一个整数 ( n ) 和一个基数 ( b )，将 ( n ) 表示为 ( b ) 进制（如二进制、三进制等）。将该 ( b ) 进制的数字逆序，并将其每一位权重按照小数点后的位置进行累加，得到一个小数值。( n = 3 )，对应二进制11。

2024-12-28 15:43:16 625

原创 WebGPU、WebGL 和 OpenGL/Vulkan对比分析

特性WebGPUWebGLOpenGLVulkan设计目标现代浏览器高性能图形API浏览器端图形渲染跨平台图形API低级高性能图形API主要用途图形渲染、计算任务图形渲染图形渲染、图形处理图形渲染、计算任务平台支持主流浏览器（Chrome、Firefox等）主流浏览器（Chrome、Firefox等）Windows、Linux、macOS等Windows、Linux、macOS、Android等API类型低级API，接近硬件控制中级API，较简单中级API，较灵活。

2024-12-18 21:22:59 734

原创如何在 Linux 中使用 `useradd` 命令创建新用户

useradd是 Linux 系统中用于创建新用户的命令。它允许管理员为新用户指定一些基本信息，如主目录、登录 shell、所属组等。useradd通常需要管理员权限，所以在执行命令时需要使用sudo。通过useradd命令，Linux 系统管理员可以轻松创建并配置新用户。无论是设置主目录、登录 shell，还是分配组和注释信息，useradd都提供了灵活的选项来满足各种需求。掌握这些基本操作后，你可以更加高效地管理系统中的用户，确保系统的安全性和可靠性。希望本文能帮助你更好地理解和使用useradd。

2024-12-16 15:26:59 1120

原创焦距与视差的关系及其对深度估计的影响

焦距在立体视觉中的作用至关重要，它直接影响视差的大小，从而影响深度估计的精度。焦距越长，视差差异越大，物体的深度估计就越精确。这一关系使得焦距长的相机在一些需要高精度深度估计的应用场景中更加优越。了解焦距与视差的关系，对于优化相机配置和提升深度估计精度具有重要意义。在实践中，选择合适的焦距对于获得精确的深度信息至关重要，特别是在自动驾驶、虚拟现实、三维重建等领域，精确的深度估计能够提供更好的用户体验和技术支持。

2024-12-13 22:04:38 1092

原创深度与视差的关系及其转换

视差（Disparity）是指在立体视觉中，同一个物体在左右两个相机图像中位置的差异。由于两台相机拍摄同一个物体时，摄像头的位置稍有不同（即相机之间有一定的基线），因此同一个物体在两个图像中的位置会发生偏移。这种偏移量，称为视差。视差值通常是通过左右图像对中的匹配算法计算得到的，匹配过程中会确定左右图像中对应点的位置差异。视差值越大，物体离相机越近；视差值越小，物体离相机越远。深度（Depth）是指物体与相机之间的实际距离。在立体视觉中，深度可以通过测量视差来估算。

2024-12-13 21:37:00 1593

原创基于双目视差的3D立体视觉原理及其应用

双目视差是指由于我们人眼间的距离（大约6.5厘米）不同，左右眼所观察到的同一物体的图像会略有差异。这种差异就是视差，它是人眼获取深度信息的关键。简单来说，双目视差的产生就是左右眼从不同角度观察场景，获得的视网膜图像有所不同。双目视差对于人类的深度感知至关重要。我们的眼睛和大脑通过对这两个视角图像的融合，能够判断出物体的空间深度，即哪些物体离我们近，哪些物体远。这种视觉处理机制使得我们能够在三维空间中准确地感知物体的位置、距离和方向，从而形成立体视觉。

2024-12-12 11:37:47 1363

原创 WebGL 中的三大矩阵：模型矩阵、视图矩阵和投影矩阵解析

矩阵变换是一种数学手段，用于将一个物体的坐标从一种坐标系转换到另一种坐标系。在三维图形学中，常见的坐标系包括：局部坐标系、世界坐标系、摄像机坐标系和屏幕坐标系。通过矩阵变换，我们可以将三维物体从局部坐标系中逐步转换到屏幕上的二维坐标。

2024-12-12 11:24:56 1612

原创从深度图到 3D 网格与点云：完整实现

点云是由多个点（每个点通常包含 x、y 和 z 坐标）构成的数据集，表示物体表面或场景的三维结构。在计算机视觉中，点云是由深度图或 LiDAR 等传感器生成的。点云提供了物体的几何形状，但通常没有连接点的三角面片信息，因此不像网格那样具有表面。

2024-12-10 22:03:28 3080

原创判断并清理文件夹：Python 自动化管理目录

通过这个简单的 Python 脚本，我们可以高效地判断并清理文件夹结构。文件夹，里面包含很多子文件夹，而这些子文件夹中有些可能只包含一个子文件夹。这种情况下，我们可能希望自动化地检查每个子文件夹，如果它仅包含一个子文件夹，则直接删除该子文件夹。在日常工作中，我们经常需要对文件系统中的文件和文件夹进行整理。本文将介绍如何用 Python 编写一个小脚本，完成这一任务，简化手动清理的过程。列出其内容，并判断哪些是子文件夹。如果子文件夹数量为 1，则符合我们的条件。文件夹下的所有文件和文件夹，然后用。

2024-12-10 21:54:39 362

原创合并视频文件：使用Python和MoviePy库的简单指南

今天，我将向你展示如何使用Python编程语言和MoviePy库来合并两个视频文件。通过这个简单的教程，你可以看到使用MoviePy合并视频是多么的直接和高效。无论你是视频编辑新手还是希望提高工作效率的专业人士，MoviePy都是一个值得尝试的工具。它不仅可以帮助你节省时间，还可以让你的视频项目更加专业。MoviePy是一个强大的视频编辑库，它允许你轻松地进行视频剪辑、合并、添加特效和文本等。MoviePy的优势在于它的易用性和灵活性，使得视频编辑变得简单直观。：定义两个视频文件的路径以及输出视频的路径。

2024-11-29 16:00:26 440

原创 Could not load the Qt platform plugin “xcb“ in ... even though it was found.

【代码】Could not load the Qt platform plugin “xcb“ in ... even though it was found.

2024-04-19 20:16:24 1383

原创数字人部署之VITS+Wav2lip数据流转处理以提高实时性

数字人 VITS 模型输出处理，提高工程实现的实时性

2023-11-13 22:41:35 2263 3

原创计算机视觉之三维重建(三)(单视图测量)

单视图重构

2023-08-19 17:53:31 1112

原创计算机视觉之三维重建(二)(摄像机标定)

摄像机标定简要记录

2023-08-17 21:00:34 1195

原创计算机视觉之三维重建(一)(摄像机几何)

不以相机光圈为起始点的转换，无非是多加一个转换矩阵。规范化投影变换：图像坐标与现实坐标一致。

2023-08-17 11:35:39 883

原创 leetcode 19. 删除链表的倒数第 N 个结点（c++）

leetcode 19. 删除链表的倒数第 N 个结点常规解法：双指针与栈，两种解法。

2023-05-06 21:00:43 199

原创 leetcode 241. 为运算表达式设计优先级（c++）

leetcode 241. 为运算表达式设计优先级题解

2023-05-04 19:26:54 228

原创 leetcode 5. 最长回文子串（c++）

【题解】leetdoe 5. 最长回文子串（c++）

2023-05-02 18:06:14 294

原创机器学习之网络优化(侧重学习率调整)

人工智能的问题在于他实在让人捉摸不透。——文森特。

2023-02-05 14:51:22 969 2

原创机器学习之卷积操作

很多好主意一旦踏上语义鸿沟，就再也听不到。卷积，在图像、视觉领域乃老生常谈的内容，但是对于具体工作细节仍然值得我去学习。

2023-02-01 22:01:22 831

原创机器学习之SVM

墙高基下，虽得必失。 ——范晔SVM即支持向量机是二分类的算法，但应用范围不局限于二分类问题。对于输入数据集{(xn,yn)}n=1N\{({x^{n},y^{n}})\}_{n=1}^N{(xn,yn)}n=1N,yn∈{−1,1}y^n \in \{-1,1\}yn∈{−1,1},需要找到决策平面或者超平面进行两类样本分离，该超平面满足wTx+b=0w^Tx+b=0wTx+b=0，两类样本分别满足yn(wTx+b)>0y^n(w^Tx+b)>0yn

2023-01-31 17:07:26 427

原创机器学习之线性模型

线性模型非常常见，但详细了解其中原理是必要的。一般将样本特征进行线性组合达到预测的目标，如表达式yfX;Wby=f(X;W)+byfX;Wb,其中XXX为输入的样本数据，WWW为权重系数，bbb为偏置系数。如对于图片样本，一种处理方式为将图片像素矩阵转化为维度向量，如Xx1x2xnWw1w2wmbb1b2bnXx1x2...xnWw1w2...wmbb1b2。

2023-01-31 11:09:02 520

原创机器学习之参数学习

参数估计的方法包括经验风险最小化、结构风险最小化、最大似然估计、最大后验估计。参数估计用于学习模型参数，以达到最优的目的，如线性回归的模型参数。

2023-01-30 16:13:05 1073

原创数字图像处理---空间滤波基础

空间滤波器对图像处理的原理

2023-01-18 17:36:38 1946

原创目标检测之FCOS算法分析

FCOS算法简要分析

2022-12-27 20:13:33 940 3

原创目标检测之YOLOv5算法分析

YOLOv5共有5个版本的网络模型及其权重文件，即。（下图来自github上yolov5官方开源项目的性能截图）其中n,s,m,l,x网络模型结构如出一辙，差异在参数上。另外的n6,s6,m6,l6,x6模型是对于更大分辨率图片检测。

2022-12-27 10:53:34 2552

原创目标检测之YOLOv4算法分析

yolov4目标检测模型的算法分析

2022-12-25 22:19:31 1322 2

原创目标检测之YOLOv3算法分析

Yolov3目标检测模型的要点分析

2022-12-25 14:07:30 805

原创目标检测之YOLOv2算法分析

第三行为负责检测物体的anchor进行该计算：其中的三个表达式分别为真实框与预测框的定位误差，真实框与anchor的IOU值和预测框置信度的误差，真实框的类别与预测框的类别误差。第二行为判断是否是前12800次迭代，是则优化anchor与预测框的位置信息，使每一个anchor确定不同的自身作用，模型稳定。，将高分辨率的特征图与低分辨率的特征图融合在一起，实现多尺度的检测效果，启发于SSD检测。个响应值求均值，标准差，然后标准化，对标准化的结果乘。图中通道数变为4倍，大小为原来的1/4，

2022-12-24 22:35:24 696

原创目标检测之YOLOv1算法分析

30维张量包括20个对象的概率，2个bounding box的置信度及其位置（一个bounding box位置信息需要四个值，两个bounding box总需要8个值）那么两个框IOU交并比，谁大就由谁负责预测一个对象，并且。2个bounding box的置信度，其中置信度=p(exist_objects) * 该预测的bounding box与该对象的真实边框的IOU值。两个bounding box的置信度分别于20个类别的概率相乘，可得到分在在两个bounding box中的每一类的概率。

2022-12-24 16:32:46 739

原创目标检测之Faster RCNN分析

滑动窗口，每一个位置得到一个256维向量（不唯一，此处backbone输出的深度为256），然后经过全连接层，得到分类的2k个分数（对应右侧指向的k个anchor，每个anchor两个参数描述前景概率与后景概率），与位置框回归的4k个参数。在上图中，从feature map层来看，有两个指向上层的箭头，其中左侧指向Region Proposal Network的即为RPN结构，右侧指向Roi pooling与fast rcnn保持一致。在原图上的anchor，每个位置有9个不同大小，三种面积{

2022-12-24 13:49:18 998