
代码复现
文章平均质量分 96
本专栏旨在复现GitHub上的一些代码以方便需要复现相同代码的同志。
东荷新绿
东池始有荷新绿,尚小如钱。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Spark-TTS】从此你的声音是我的了
本文主要讲解了从克隆Spark-TTS库到进行声音克隆的过程,包括安装依赖、下载权重、UI界面及问题解决等。原创 2025-03-22 20:23:27 · 1120 阅读 · 0 评论 -
【DeepSeek本地化部署保姆级教程 】20分钟带你轻松配置与高效运行
为了方便本地化部署并高效进行大模型推理任务,可以按照以下步骤操作:下载和安装:在LM Studio官网下载对应的版本,并选择安装位置或自定义安装点。配置与设置:点击右上角跳过菜单,进入右下角的“设置”,设置语言为中文。并在线搜索目标模型。模型加载与管理:通过搜索结果点击模型即可加载到当前工作目录中,确保模型文件已正确下载并保存。项目配置:在空间富余盘创建存储模型的文件夹,如 deepseek_model。将训练好的模型文件复制到该文件夹下,并设置为当前工作目录。推理与验证:在对话框中输入问题即可。原创 2025-02-19 14:37:58 · 1454 阅读 · 0 评论 -
【TPAMI-2024】EfficientTrain++帮你降低网络训练的成本
该出了一种新的广义课程学习方法EfficientTrain++,总是利用每个学习阶段的所有数据,但只在训练开始时暴露每个示例的“容易学习”模式(例如,在数据增强之前,图像和原始信息的低频成分),并随着学习的进展逐渐引入更困难的模式。为了设计一个合适的课程学习计划,提出了一个定制的计算约束的顺序搜索算法,产生一个简单的,良好的泛化,但惊人的有效的训练课程。原创 2024-06-04 14:53:00 · 1231 阅读 · 0 评论 -
【U-Net验证】逐元素乘积将特征投射到极高维隐式特征空间的能力
本文将U-Net解码中的特征拼接修改为逐元素求和和逐元素乘积,并针对血管分割任务进行了性能评估。实验结果显示,在无激活函数时,逐元素乘积在多个关键指标上均优于逐元素求和,性能提升幅度在0.2%至3%之间,表明逐元素乘积确实能在一定程度上提供更高维度的隐式空间。从分割结果来看,逐元素乘积似乎对较大的血管具有更好的分割效果,能够更准确地捕捉血管的轮廓和细节。同时,使用逐元素乘积的分割结果也表现出更高的光滑性和一致性,减少了噪声和伪影的干扰,从而提高了分割结果的可靠性和可读性。原创 2024-06-02 13:02:32 · 746 阅读 · 0 评论 -
PSFRGAN量化:量化技术、实现步骤与常见问题解决
本文深入探讨了PyTorch框架下的模型量化技术,介绍了量化的一般流程,包括动态量化和训练后量化等,以PSFR-GAN为例,详细介绍了其训练后静态量化的步骤,包括模型加载、静态量化、模型定义、QuantStub和DeQuantStub的使用,以及运算改写等关键步骤。同时,文章也记录了在量化过程中遇到的一些问题和挑战。原创 2024-05-12 14:13:08 · 861 阅读 · 0 评论 -
PSFR-GAN复现
PSFR-GAN是一个基于深度学习的开源项目,其主要目标是实现高质量的人脸图像盲复原。PSFR-GAN的核心是生成对抗网络,包括两个部分:生成器和判别器。生成器负责从低分辨率图像生成高分辨率图像,而判别器则试图区分真实高分辨率图像与生成器产生的图像。在训练过程中,这两个网络相互竞争并共同提升,直至生成器可以产出难以被判别器识破的高分辨率图像。PSFR-GAN在图像超分辨率重建方面有以下特点:结合了几何先验,能够生成具有清晰面部形状和逼真面部细节的图像。原创 2024-05-06 12:32:30 · 1037 阅读 · 0 评论 -
你的轻量化设计能有效提高模型的推理速度吗?
轻量化网络是指在保持较高性能的同时大大减少模型参数和计算量的神经网络模型。轻量化网络的出现是为了解决在移动设备和嵌入式系统等资源受限的环境中部署深度学习模型时所面临的挑战。传统的深度学习模型通常包含大量的参数和复杂的计算结构,这使得它们在移动设备上运行时需要消耗大量的内存和计算资源。而轻量化网络通过精心设计结构和参数,可以在移动端实现更加高效的部署,从而适应移动设备上的应用需求。因此轻量化网络的研究和发展是深度学习领域的一个重要方向,涉及网络结构设计、模型压缩、量化技术、剪枝等多个方面。原创 2023-12-07 15:08:27 · 1526 阅读 · 0 评论 -
正则化与正则剪枝
正则化是一种在机器学习中用于控制模型复杂度的技术,它通过在损失函数中添加一个额外项来对参数进行约束,从而避免过拟合。其中,L1正则化通过对参数的绝对值求和来实现,能够产生稀疏权重;L2正则化通过对参数的平方和求根号来实现,能够产生较为平滑的权重;实际上可以结合两者来共同约束参数。在实际应用中,正则化可以帮助模型更好地泛化数据,提高模型的鲁棒性和可靠性。同时,正则化也需要根据具体问题进行调整,不同的正则化方法和系数可能会产生不同的效果。原创 2023-11-26 21:58:01 · 1539 阅读 · 0 评论 -
MobileNets发展与总结
MobileNet是一种轻量级的深度卷积神经网络(CNN),旨在在计算资源有限的移动设备上实现高效的图像分类和目标检测。MobileNet的设计出发点是通过减少模型参数和计算量来提高模型的速度和效率,同时尽可能保持模型的准确性。MobileNet首先引入了深度可分离卷积(Depthwise Separable Convolution)结构。随后MobileNet后续由一系列的Inverted Residual Blocks组成。原创 2023-11-25 14:15:07 · 1180 阅读 · 0 评论 -
从头到尾的一次模型搭建训练测试流程
本博客仅为学习记录之用,目的在于后续若需要相关的有资可查。在言语上恐有诸多纰漏,如有错误,欢迎指出交流学习!本博客所包含的大致内容:一个简单的模型搭建流程,包括:数据加载、模型结构、训练网络、指标计算及绘图、README.md撰写等等。相关涉及内容:解析命令行的简单使用;记录日志;混淆矩阵;ROC曲线等。原创 2022-08-10 15:09:33 · 669 阅读 · 0 评论 -
构建高效、精准的人脸识别系统——RetinaFace、FaceNet和MySQL基础上的实践与总结
本文讨论的人脸识别方法主要分为三个部分,其中第一个部分是检测网络RetinaFace,用于检测人脸;第二个部分是Facenet,用于生成身份识别所需的特征,第三部分是基于Mysql的人脸特征存储与识别。该方法具有精度较高、鲁棒性强、实时性好、数据库管理方便的特点。本文将从基础准备、人脸检测、人脸处理、身份识别、以及数据库等方面进行说明,内容有点长,请耐心看完。原创 2023-05-15 20:17:30 · 1615 阅读 · 0 评论 -
【Mmediting的使用踩坑记录】
足下潇洒美少年,举觞白眼望青天,皎如玉树临风前。Mmediting是一个由开发者大力维护的开源深度学习库,它致力于提供高效和先进的图像和视频编辑工具。基于PyTorch实现,Mmediting依赖于许多常见的深度学习库,例如CUDA和CUDNN,以实现高性能的图像和视频处理。它提供了强大的超分辨率、去噪、修复、颜色转换、图像合成、视觉效果等功能,可以帮助用户在不同的应用场景下完成各种图像和视频处理任务。原创 2023-05-01 20:50:49 · 399 阅读 · 0 评论 -
【基于BasicSR的GCFSR复现踩坑】
超分辨率是指将低分辨率图像通过算法提升其分辨率,使其看起来更加清晰、细腻。在计算机视觉领域,超分辨率技术应用广泛,包括图像处理、视频压缩、安防监控等。为了进行超分辨率项目开发,需要配置相应的环境。一般来说,超分辨率算法需要依赖于深度学习框架和图像处理库等多个组件。GCFSR是一种无需GAN先验的生成式超分辨率方法,旨在提高人脸图像的分辨率。该方法采用了Encoder-Generator架构,并设计了样式调制模块和特征调制模块。原创 2023-03-21 10:46:12 · 3061 阅读 · 57 评论