- 博客(14)
- 收藏
- 关注
原创 JPEG AI可变速率编码
JPEG-AI的可变速率编码技术通过动态调整量化参数实现灵活压缩控制。该技术采用三维质量图(通道质量图和空间质量图)进行比特分配,结合条件颜色分离框架独立处理亮度和色度分量。核心机制包括:1)比特率匹配算法确保目标比特率偏差小于10%;2)多模型训练支持0.12-2.0bpp的宽广速率范围;3)通过分析变换网络结构调整实现不同压缩比需求。实验表明该技术较传统标准(如VVCintra)可获得13.1%-19.2%的BD-rate增益,特别适用于移动设备实时解码等场景。关键技术包括量化步长控制、ROI优化和硬件
2025-07-07 10:37:14
1126
原创 基于FPGA的卷积神经网络CNN设计+基础知识回顾Verilog/HLS
文章详细解析了CNN各层设计,包括卷积层、激活层的硬件实现,并深入讨论了半精度浮点数(FP16)在FPGA上的优势与实现细节。同时,还涵盖了FPGA开发的关键技术,如Vivado HLS高层次综合、IP核(RAM/FIFO/UART等)的使用方法,以及IIC、SPI等通信协议的硬件实现。通过Processing Element等定制化计算单元的设计,实现了CNN在资源受限的FPGA上的高效部署,为嵌入式AI应用提供了可行的解决方案。
2025-07-06 15:23:24
1884
原创 JPEG AI
图像压缩领域的最新进展之一是 JPEG AI 标准的开发 ,这是由联合图像专家组(JPEG)正在开发的一种先进图像压缩标准。与 JPEG、JPEG 2000 和 JPEG XL 等传统基于变换的编解码器不同,这个新标准采用基于深度学习的图像编码技术来学习最优的编码和解码策略。通过利用神经网络驱动的模型,JPEG AI 在保持卓越视觉保真度的同时实现了更高的压缩效率,标志着向人工智能驱动的端到端图像压缩的变革性转变。
2025-04-15 12:13:50
1790
原创 FPGA加速卷积神经网络CNN策略
FPGA 加速的本质是 “算法复杂度与硬件资源的精准匹配”—— 通过算法优化(量化、剪枝、Winograd)减少计算量和数据量,通过架构设计(并行、流水线、脉动阵列)最大化 FPGA 并行能力,通过硬件映射(DSP/BRAM/DDR 协同)避免资源瓶颈,最终实现 “高性能、高能效、低延迟” 的 CNN 推理。未来方向:结合存算一体架构(如将权重存储在 SRAM 中,计算单元直接在存储内操作,减少数据搬运)、异构融合。
2025-09-21 09:29:54
934
原创 基于 FPGA 的实时应用高速图像压缩技术实现
本文研究了基于FPGA的高速图像压缩算法实现,重点分析了其在实时性、效率及架构优化方面的优势。研究采用离散小波变换(DWT)技术,在VLSI架构中实现了完整的硬件压缩方案。实验表明,该系统在256×256像素图像处理中延迟仅2.3ms,帧率达435fps,压缩比达7.8:1,PSNR为36.1dB,性能显著优于传统软件和GPU方案。FPGA的并行处理能力使其特别适用于医疗成像和安防监控等实时场景,同时具备低功耗(18W)和可重构性优势。研究还指出了当前系统在浮点运算支持和超高清处理方面的局限性,并提出了融合
2025-08-22 11:19:04
1025
原创 高光谱图像.tif/.tiff格式转化为.mat格式(以Washington DC和Houston DFC 2018为例)
本文介绍了两种将TIFF格式高光谱图像转换为MAT格式的方法。以WashingtonDC(1280×307×191)为例,使用scikit-image读取TIFF文件后,通过numpy调整维度顺序并转换为float64类型,最后使用scipy.io保存为MAT文件。对于HoustonDFC2018(1202×4172×50)数据,则直接转换数据类型后保存。两种方法均实现了Python与MATLAB之间的数据格式转换,便于后续处理和分析。
2025-07-22 16:10:05
426
原创 将高光谱图像.raw格式变为.mat格式
这篇博客介绍了高光谱图像数据处理的格式转换方法,重点讲解了将RAW格式转换为MAT格式的两种方案。第一种方法使用ENVI和MATLAB软件分步处理,第二种方法提供了完整的Python脚本实现,支持读取HDR元数据并处理BIL/BIP/BSQ三种排列格式。脚本能自动识别数据类型和字节顺序,输出包含三维数组和元数据的MAT文件,方便后续深度学习应用。文章还对比了MAT格式的优势(支持多维数组、保留元数据)及适用场景,为高光谱数据处理提供了实用解决方案。
2025-07-18 12:58:34
341
原创 Origin2024 bug 画图时坐标轴头上有一条粗横线解决办法
若使用的是 Origin 2024 旧版本,可能存在该横线 bug。据相关测试,Origin 2024b 版本已完美解决了图表粘贴到 Word 和 PPT 时出现多余横线的问题,可尝试将软件更新到 Origin 2024b 及以上版本,以消除横线。
2025-07-17 21:15:54
4993
转载 基于FPGA的深度卷积神经网络设计方案
摘要: 本文探讨FPGA上实现3D卷积的并行化设计方法,通过将其分解为多个并行2D卷积,包括输入通道间、输出特征图间及层间并行。针对FPGA硬件特性,分析采用定点数量化的优势:1)更适配整数运算,节省逻辑资源;2)运算速度快、功耗低,满足边缘计算实时性需求;3)结合CNN容错性,量化后精度损失可控,且显著优化存储与带宽。现有工具支持浮点模型到定点模型的自动化转换,但需权衡资源与精度。当前挑战在于如何进一步优化并行效率与量化精度,以适应嵌入式场景的严苛约束。
2025-07-09 12:17:06
147
原创 JPEG AI标准概述
JPEGAI是新一代基于深度学习的图像压缩标准,采用神经网络驱动的端到端编码技术。与传统变换编码不同,它通过分析变换、潜在域预测和超编码等步骤实现高效压缩,利用算术编码和共享概率模型。解码时反向执行编码流程,通过超尺度解码和上下文模型重建图像。该标准支持YUV色彩空间,对主/副分量分别处理,在保持高视觉质量的同时显著提升压缩效率,标志着AI图像压缩的重要突破。
2025-07-07 13:27:01
1014
原创 基于多级上下文模型(MCM)的 JPEG AI
不过,MCM 在预测时存在一些问题。另一方面,由于 MCM 的使用,BaseOP 和 HighOP 生成的残差特征不同,前者在编码器特征的原始尺度上,利用超解码器产生的预测生成残差特征;许多最近的最先进的 LIC 编解码器利用空间上下文模型,其基于已解码的周围潜在代码推断当前潜在代码的概率分布,大大优于基于超先验的方法。在 BaseOP 中,残差特征是利用超解码器在编码器特征的原始尺度上产生的预测生成的,而在 HighOP 中,残差特征是通过 MCM 在较低尺度上逐步生成的,然后上混洗到原始尺度。
2025-07-06 21:37:28
961
原创 训练时遇到Could not load library libcudnn_cnn_train.so.8问题
只需要重新下载或者链接一下即可解决该类型报错。此类报错基本是C++动态库丢失或者链接不上。,就可以链接上库了。
2025-06-03 20:59:46
612
原创 WSL2+Ubuntu24.04+pycharm深度学习环境配置
本文将指导如何在Windows系统上安装WSL(Windows Subsystem for Linux),并配置深度学习环境。首先,确保CPU虚拟化功能已开启,并在Windows功能中启用“适用于Linux的Windows子系统”和“虚拟机平台”。接着,通过命令行安装所需的Linux子系统,并可以将其导出或移动到其他磁盘。安装完成后,可以进一步配置WSL2环境,包括安装Anaconda、PyTorch、CUDA和cuDNN等深度学习工具。此外,还提供了如何解决安装CUDA时可能遇到的gcc版本不匹配问题的建
2025-05-15 19:14:55
1845
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅