一只枫林-优快云博客

原创 VueDPlayer视频插件的使用

VueDPlayer 是一个基于 DPlayer 的 Vue 封装组件，DPlayer 是一个 HTML5 视频播放器，支持弹幕、视频倍速播放、视频预加载等功能。VueDPlayer 使用了 DPlayer 的默认样式，你可以在你的项目中覆盖这些样式。通过这些步骤，你可以在 Vue.js 应用程序中方便地使用 VueDPlayer 来播放视频，并根据需要进行配置和自定义。中配置 VueDPlayer 的各种选项，例如视频源、封面图片、弹幕、视频质量等。在你的 Vue 组件中，你可以通过。

2024-11-18 09:45:32 1151

原创 ‘v-scale-screen‘使用（Vue框架的大屏幕自适应组件）

是一个用于 Vue 框架的大屏幕自适应组件。它可以帮助开发者在开发大屏幕项目时实现屏幕的自适应，支持根据宽度、高度以及宽高比进行自适应调整，并且支持全屏自适应。这个组件适用于 Vue 2.7 及以上版本和 Vue 3 版本。

2024-11-15 15:00:38 2386

原创【异常行为检测】【论文阅读】Self-Distilled Masked Auto-Encoders are Efficient Video Anomaly Detectors

发表单位：罗马尼亚布加勒斯特大学、NUST Politehnica Bucharest、SecurifAI、MBZ University of Artificial Intelligence、Linköping University 和 University of Central Florida。总结来说，这篇论文通过提出一种新颖的轻量级自编码器模型和自我蒸馏训练流程，有效地提高了视频异常检测的速度和准确性，对视频监控领域的异常事件检测具有重要意义。实验数据库：Avenue、shanghai。

2024-11-06 16:09:32 1156 1

原创 MYSQL服务无法启动，服务没有报告任何错误，怎么办？？

①MYSQL启动路径不正确，需将路径指定到MYSQL下载后所在文件夹的bin文件夹中.②尝试清除data数据，重新下载.③初始化MYSQL④下载的MYSQL可能为8.0版本，使用以下命令启动MYSQL

2024-10-30 16:11:42 935

原创【行为检测】【论文阅读】Temporal Action Localization in Untrimmed Videos via Multi-stage CNNs

复合损失函数的设计使得模型在训练过程中不仅关注分类的准确性，还关注预测片段与真实动作的时间重叠度，从而提高了动作定位的精度。通过这种方式，模型被鼓励提高与真实动作实例重叠度高的片段的预测置信度，同时降低重叠度低的片段的置信度，这对于后续的后处理步骤（如NMS）非常有利。

2024-10-30 15:42:40 730 1

原创基于模拟退火算法训练模型

模拟退火算法的核心思想是：通过控制温度的逐渐降低，使得算法初期能够充分探索解空间，接受较大范围的解，从而避免陷入局部最优；在算法后期通过降温减少解的接受概率，逐步收敛到全局最优解。

2024-10-30 15:32:05 383

原创 conda虚拟环境创建、查找、删除等常用指令

Conda 是一个流行的包管理和环境管理工具，特别适用于Python和其他语言的开发。以下是一些常用的 Conda 命令.

2024-10-18 14:40:31 747

原创 TensorBoardX库实现数据可视化

首先，你需要安装 TensorBoardX 和 TensorBoard。TensorBoardX 提供了丰富的 API 来记录不同类型的数据，包括直方图、图像、音频、文本等。你可以使用 `writer.add_scalar` 方法来记录标量数据，例如训练和验证的损失和准确率。如果你想在 TensorBoard 中可视化模型的结构，可以使用 `writer.add_graph` 方法。在你的 PyTorch 项目中，你需要导入 `SummaryWriter` 类，并创建一个实例。这个实例将用于记录你的数据。

2024-10-18 14:32:11 381

原创多GPU训练之通道并行（pytorch）

在深度学习中，通道并行（Channel Parallelism）通常指的是将模型的不同通道分配到不同的GPU上进行训练。在PyTorch中实现通道并行需要手动分割模型和数据，并确保数据在正确的通道和GPU之间传输。在数据加载时，需要将输入数据分割成多个通道，并将每个通道的数据发送到对应的GPU。- 通道并行需要仔细管理数据和模型的分割，确保数据在正确的通道和GPU之间传输。- 通道并行可能需要更多的手动操作，包括数据的分割和模型的合并。- 通道并行的效率取决于模型的结构和数据的分布。

2024-10-15 15:56:52 415

原创多GPU训练之数据并行（pytorch）

当使用`DataParallel`时，模型的所有参数和缓存将被复制到每个GPU上，但只有主GPU上的参数会被更新。通过这些步骤，你可以利用PyTorch的`DataParallel`模块在多个GPU上并行训练你的模型，从而加速训练过程。- `DataParallel`自动处理数据的分割和结果的聚合，但你可能需要确保数据加载器正确地将数据分配到多个GPU上。使用`torch.nn.DataParallel`将模型包装起来，使其能够在多个GPU上并行运行。定义你的模型或加载一个预训练模型。

2024-10-15 15:50:01 584

原创多GPU训练之模型并行（pytorch）

在PyTorch中实现模型并行通常涉及到将模型的不同部分放置在不同的GPU上。这可以通过`torch.nn.parallel.DistributedDataParallel`模块来实现，它提供了一种相对简单的方法来自动处理模型的分割和数据的分配。使用`DistributedDataParallel`来包装模型，这将自动处理模型的分割和数据的分配。- 模型并行通常需要更多的设置和调试工作，特别是在处理复杂的模型结构时。接下来，创建模型并将其不同部分分配到不同的GPU上。在程序结束时，清理进程组资源。

2024-10-15 15:41:57 621

原创【论文阅读】【通过单反镜头获取微光增强成对数据集】【一种弱监督微光增强方法的假设】

图像增强的定义非常广泛，一般来说，图像增强是有目的地强调图像的整体或局部特性，例如改善图像的颜色、亮度和对比度等，将原来不清晰的图像变得清晰或强调某些感兴趣的特征，扩大图像中不同物体特征之间的差别，抑制不感兴趣的特征，提高图像的视觉效果。现有的方法大多是有监督的学习，对于一张原始图像和一张目标图像，学习它们之间的映射关系，来得到增强后的图像。通过学习手机拍摄的照片和单反照片之间的映射关系来将手机拍摄的照片提升到单反水平，这是一个端到端的训练，不需要额外的监督和人为添加特征。其网络结构采用的是GAN模型。

2024-10-15 10:35:23 947 1

原创【微光增强】【论文阅读】Learning a Simple Low-light Image Enhancer from Paired Low-light Instances

此外，该方法混淆了无监督的概念，其光照度L的学习仍然离不开成对不同光照的低光照图像有监督学习，只是在此基础上用了λ（光照校正因子对学习到的光照微弱增强的图像进行光照的再增强）。通过成对低光照图像通过网络学会从低光照图像获取反射率R（R由物体本身决定）和光照度L（由外界光照决定），再通过光照度L由低光照图像到干净图像的变换函数g(·)，再对两组网络进行拼接，最后I=g(L)*R。在公共数据集上进行的大量实验表明，与最先进的方法相比，所提出的PairLIE具有更简单的网络和更少的手工先验，实现了相当的性能。

2024-10-14 14:32:15 1115 1

原创【论文阅读】基于轮廓修补和图像差分的表面缺陷检测

过高的人力成本和人工检测的效率低下使基于机器视觉的自动光学检测系统(AOI)在工业检测领域得到了较好的应用，其核心组成部分有图像采集模块、图像处理和分析模块、数据接口和人机交互模块等。而近些年，智能手机朝着全面屏化方向发展，玻璃盖板边缘黑墨部分越来越少，因此有必要开发出针对性的缺陷检测算法，以提高实时检测效率。Step3：如果有轮廓面积A小于50，且圆度率小于0.5，则定位到该轮廓最小外接矩形，计算四个顶点的均值。采用最小外接矩形的均值点进行缺陷修补，如果均值点处为缺陷处将导致缺陷结果放大。

2024-10-13 00:21:29 371

原创【行为检测】【论文阅读】CTAP: Complementary Temporal Action Proposal Generation

总结来说，这篇论文通过结合滑动窗口和动作性得分分组方法的优点，提出了一种新的时序动作提案生成方法，并通过实验验证了其有效性，个人觉得就是提出了一个网络结构去学习行为检测，另外论文没有给出模型具体结构图。主要作者：Jiyang Gao and Kan Chen and Ram Nevatia。实验数据库：THUMOS-14和ActivityNet 1.3。2、与之前阅读文章比较技术思路不同点。3、与之前阅读文章比较实验结果不同点。发表单位：南加州大学。

2024-10-10 16:51:39 1007 1

原创【微光增强】【论文阅读】2022年一区期刊上发表的一种传统微光增强方法：ALow-light Image Enhancement Method Balancing Brightness...

其中，Rc 是原始反射率图，Gσi(R) 是对 R 应用高斯滤波器后的结果，σ1,σ2,σ3 是不同尺度的滤波算子，用于表示不同尺度的平滑效果，w1,w2,w3 是权重系数，用于控制不同尺度细节的贡献。本文在JED的基础上改进并提出了一种新的低光照图像增强方法，该方法不仅提升了图像的亮度和对比度，还有效平滑了噪声并保留了细节，与一些经典方法相比，在定性和定量评估中均展现出优越性能。其中，L~ 是校正后的光照图，R~ 是增强后的反射率图。其中，S 是观测图像，L 是光照图，R 是反射率图。

2024-10-10 16:29:54 1091 1

原创几种激活函数和损失函数的优缺点，场景

3、relu函数优点：目前最受欢迎的激活函数，在x<0时，硬饱和，在x>0时，导数为1，所以在x>0时保持梯度不衰减，从而可以缓解梯度消失的问题，能更快收效，并提供神经网络的稀疏表达能力缺点：随着训练的进行，部分输入或落入硬饱和区，导致无法更新权重，称为神经元死亡。应用场景：应用最广泛的激活函数，只在隐藏层中使用。导数不连续，导致求解困难。一、损失函数定义：机器学习模型关于单个样本的预测值与真实值的差称为损失，损失越小，模型越好，如果预测值与真实值相等，就是没有损失：用于计算损失的函数称为损失函数。

2024-10-10 10:14:06 692

原创基于FPGA的交通灯项目实现（VHDL）

初始态是两个路口的红灯全亮，之后，东西路口的绿灯亮，南北路口的红灯亮，东西方向通车，延时一段时间后，东西路口绿灯灭，黄灯开始闪烁。黄灯闪烁若干次后，东西路口红灯亮，而同时南北路口的绿灯亮，南北方向开始通车，延时一段时间后，南北路口的绿灯灭，黄灯开始闪烁。系统时钟选择1KHz，黄灯闪烁的时钟要求为2Hz，七段数码管的时间显示频率为1Hz，即每1s递减一次。在显示时间小于3秒的时候，通车方向的黄灯以2Hz的频率闪烁。在显示时间小于3秒的时候，通车方向的黄灯闪烁。输入：时钟源，按键开关。

2024-10-10 10:02:01 876 1

原创 CycleISP: Real Image Restoration via Improved Data Synthesis

其解决方法在于先将RGB干净图像转换为相机ISP处理前的RAW格式干净图像，再对RAW图像进行加噪，将RAW格式含噪图像转变为RGB格式含噪图像，从而获得RGB图像对用于学习去噪。Td经过最后的卷积层M1得到图片I’，且M1的输出为三通道，以尽可能保存更多原始图像的结构信息，同时此结构也帮助网络更快、更准确的学习到从sRGB到RAW的映射。ε是数值稳定的极小值。注意此处的Iraw不是学习结果，而是从相机中得到的数据，因为这里的目标是独立学习RAW到sRGB的映射。实验结果学习的是该合成噪声方式的逆过程。

2024-10-09 10:47:35 937

原创基于BEFUnet的医学图像分割【BEFUnet论文阅读】

为应对这些难题，本研究采用了一种改进的U型网络架构，名为BEFUnet，该架构通过强化对物体局部和边缘信息的整合，以实现更精准的医学图像分割。这些步骤有助于提升图像质量，增强不同组织和器官的区分度，确保多模态图像的空间对齐，增加数据集的多样性，提高模型的泛化能力，并减少训练过程中的错误。我们提出了一个名为DLF的新模块，该模块通过以最小的(Ps)和最大的(Pl)级别作为输入，并使用交叉注意机制融合信息来解决CNN在有效合并Swin transformer各级特征的同时难以保持特征一致性的问题。

2024-10-08 16:58:41 1883 1

原创基于yolov8的水下目标检测实验报告

池化的操作是为了结合更多种的池化结果，多尺度融合，保证特征提取信息更丰富，SPP利用不同的卷积核大小进行分别池化，进行多尺度融合，但计算量较大，而SPPF利用三次连续池化，降低了计算量，并且结合了每一层的输出，保证了多尺度融合的同时，降低了计算量，并且还相比较进一步增大了感受野。本次目标检测的训练采用两张1080的GPU训练，因此，最大能接受模型尺寸为l的模型进行训练，如果仅采用单张1080的GPU则最大只能接受模型尺寸为m的模型进行训练，为了让训练结果拥有更高的MAP值。

2024-10-08 16:48:27 1438

原创通过python修改yolo的.txt文件标签号

在代码的'Path of your label'处填入你的标签.txt文件所在的文件夹路径，modified_lines变量的第一个字节为修改后的标签号，这里是将标签号修改为'1'。

2024-10-08 15:56:10 375

原创【Nature封刊】Heat Assisted Detection and Ranging【该文章matlab代码跑通步骤，及其输入数据】

④使用matlab打开mainTex.m文件（我这里使用Notepad++打开进行展示）,填写以下几个路径（其中pathname是指文件路径，我这里使用当前matlab所指路径；filename是指测试所用文件名，这里填入压缩包解压后自带的test.bsq的文件名；该代码输入数据的.mat文件可能包含了材质库、天空光照度等信息。③matlab路径指到F:\\Tex_code\。⑤在matlab中运行mainTex.m即可。

2024-10-08 11:35:31 500

原创 yolov5的P234检测头和P345检测头哪个检测小目标较好？

分析网络结构发现，P5检测头相比于P3检测头，是通过增大卷积核为3和增大步长为2，从而起到下采样的作用，形式UNet结构，而要获得检测小目标的能力，必然离不开小的尺度，也就是说下采样的次数越多，便能够获得更强的学习检测小目标的能力。部分文章认为P234相比于P345有更强的检测小目标能力，但实验结果并不是如此，且P345效果优于P234，而结构上P345也能够获取更低尺度的信息。先说结论：实验发现P345检测头的小目标检测效果优于P234检测头，但部分地方将P234认定为小目标检测头。

2024-10-08 10:42:54 612

原创 Latent Disentanglement for Low Light Image Enhancement【论文阅读】

本文提出一种基于潜在解缠的增强网络（LDE-Net），其中潜在解缠模块在潜在空间中解缠输入图像，使得解缠的内容和光照组件中不再存在污染。潜在解缠‌是指将数据中的潜在特征或属性分解为不同的因素或维度，以便更好地理解和控制这些因素对观察结果的影响。潜在解缠的目标是将高度相关的特征或属性分离出来，使它们能够单独影响模型或结果，从而提高模型的解释性和可控性‌。许多基于学习的低光图像增强算法基于Retinex理论，但这些模型中的Retinex-based分解技术引入了限制其增强性能的污染。

2024-10-08 10:16:57 268 1

原创 Brighten-and-Colorize: A Decoupled Network for Customized Low-Light Image Enhancement

总的损失函数 Ltotal 是这些损失的加权和：Ltotal=λ1Llightness+λ2Lssim+λ3Ltv+λ4Lchrominance+λ5Lperceptual+λ6Lclass其中，λ1 到 λ6 是各个损失项的权重，用于平衡它们对总损失的贡献。CIELAB颜色空间将颜色信息从RGB的三个通道（红、绿、蓝）分离成两个不相关的维度：亮度（L）和色度（A和B），其中A和B通道表示颜色的对立属性，例如从绿色到红色和从蓝色到黄色。3、与之前阅读文章比较实验结果不同点。

2024-10-08 10:00:46 1399

原创 Temporal Action Localization in Untrimmed Videos via Multi-stage CNNs

复合损失函数的设计使得模型在训练过程中不仅关注分类的准确性，还关注预测片段与真实动作的时间重叠度，从而提高了动作定位的精度。通过这种方式，模型被鼓励提高与真实动作实例重叠度高的片段的预测置信度，同时降低重叠度低的片段的置信度，这对于后续的后处理步骤（如NMS）非常有利。这里，vn 表示第 n 个样本片段与真实动作实例之间的IoU重叠度量，[kn>0] 是一个指示函数，当 kn>0（即样本为正样本）时值为1，否则为0。作者提出了一个结合了softmax损失和重叠损失的复合损失函数。

2024-10-08 09:54:47 595