- 博客(87)
- 资源 (3)
- 收藏
- 关注
原创 论文精读-Supervised Raw Video Denoising with a Benchmark Dataset on Dynamic Scenes
1、构建了一个用于监督原始视频去噪的基准数据集。为了多次捕捉瞬间,我们手动为对象s创建运动。在高ISO模式下捕获每一时刻的噪声帧,并通过对多个噪声帧进行平均得到相应的干净帧。2、有效的原始视频去噪网络(RViDeNet),通过探索非局部的空间、信道和时间相关性。由于噪声输入具有拜耳模式特征,将其分割为4个独立序列,即RGBG序列,分别经过预去噪、对齐、非局部注意和时间融合模块,然后通过空间融合重建无噪声版本。3、在RAW域的去噪结果,通过ISP之后得到的RGB域图像也比普通的图像RGB域去噪效果好。
2024-09-07 21:42:25
1282
原创 论文精读-ReMoNet: Recurrent Multi-Output Network for Efficient Video Denoising
1)应用单帧图像去噪算法,不使用任何时间信息yi=f(xi)。这属于传统的视频去噪方法,其通常将图像去噪方法推广到其视频处理对应部分。e.g.VBM4D2)使用显式的时间建模。3)使用隐式时间建模。其中,wi(xj)使用显式运动估计(如光流)去噪从第j帧到第i帧的扭曲,f表示深度神经网络参数化的去噪函数。第3点区别第2点在于没有使用显示建模中的流量估计wi而2、3点实际是利用时间相干性和帧间关系即视频中的时间一致性,这是与第1点的明显区别。
2024-09-01 20:31:26
1173
原创 MFCC C++实现与Python库可视化对比
在音频、语音信号处理领域,我们需要将信号转换成对应的语谱图(spectrogram),将语谱图上的数据作为信号的特征。语谱图的横轴x为时间,纵轴y为频率,(x,y)对应的数值代表在时间x时频率y的幅值。通常的语谱图其频率是线性分布的,但是人耳对频率的感受是对数的(logarithmic),即对低频段的变化敏感,对高频段的变化迟钝,所以线性分布的语谱图显然在特征提取上会出现“特征不够有用的情况”,因此梅尔语谱图应运而生。
2024-08-27 22:40:22
1603
1
原创 论文精读-Practical Blind Image Denoising via Swin-Conv-UNet and Data Synthesis
对于网络架构设计,我们提出了一个swan -conv块,将残差卷积层的 局部建模能力和swin变压器块的非局部建模能力结合起来,然后将其作为主要构建块插入到广泛使用的图像到图像翻译UNet体系 结构中。对于训练数据的合成,我们设计了一个实用的噪声退化模型,该模型考虑了不同类型的噪声(包括高斯白噪声、泊松噪 声、散斑噪声、JPEG压缩噪声和处理后的相机传感器噪声)和大小调整,并采用了随机洗牌策略和双重退化策略。虽然由于噪声假设不匹配,AWGN训练的深度图像去噪模型对大多数真实图像表现不佳。
2024-07-24 11:08:59
1161
原创 conda添加镜像源与channels以及pip install:no space left
和channels都是.condarc文件中用于配置软件包源的选项,但它们之间有一些不同。是一个字典,其中包含了自定义软件包源的名称和URL。当你运行等命令时,如果指定了自定义软件包源的名称,conda会使用中列出的对应URL进行搜索。需要注意的是,如果你在命令行中指定了软件包源,conda会优先使用指定的软件包源,而不是中列出的软件包源。是一个列表,其中包含了conda搜索软件包时需要使用的默认软件包源。当你运行等命令时,如果没有指定软件包源,conda会使用中列出的软件包源进行搜索。和不同的是,
2024-06-14 11:18:01
2016
原创 论文略读-Activating More Pixels in Image Super-Resolution Transformer
对于给定的低分辨率(LR)输入ILR∈RH×W ×C in,我们首先利用一个卷积层提取浅低特征F0∈RH×W ×C,其中Cin和C表示输入和中间特征的通道号。然后,利用一系列残余混合注意组(RHAG)和一个3 ×3卷积层HConv(·)进行深度特征提取。之后,我们添加一个全局残差连接,融合浅层特征F0和深层特征FD∈RH×W ×C,然后通过重构模块重构高分辨率结果。如图4所示,每个RHAG包含几个混合注意块(HAB),一个重叠的交叉注意块(OCAB)和一个带有残余连接的3 ×3卷积层。
2024-05-21 15:25:35
1207
原创 论文略读Feature Modulation Transformer Cross-Refinement of Global Representationvia via HFP for Image SR
浅层特征提取模块由单个卷积层组成,重建模块后面是SwinIR[21]。RCRFG组件由多个交叉细化融合块(crfb)组成,每个融合块由三种类型的块组成:高频增强残差块(hferb)、移位矩形窗口注意块(SRWABs)和混合融合块(HFBs)。输入LR图像经过3×3卷积层处理,获得浅层特征。然后将这些特征输入到一系列rcrfg中以学习深度特征。在最后一次RCRFG之后,一个3 ×3卷积层对特征进行聚合,并在其输出与浅层特征之间建立残差连接,便于训练。
2024-05-21 11:31:16
1387
原创 论文精读-Swin Transformer Hierarchical Vision Transformer using Shifted Windows
Swin可以作为计算机视觉的通用骨干。将Transformer从语言适应到视觉的挑战来自于这两个领域之间的差异,例如视觉实体的规模差异很大,以及图像中像素与文本中的单词相比的高分辨率。为了解决这些差异,我们提出了一个分层Transformer,其表示是用移位窗口计算的。移位窗口方案通过将自关注计算限制在非重叠的局部窗口,同时还允许跨窗口连接,从而提高了效率。这种分层架构具有在各种尺度上建模的灵活性,并且相对于图像大小具有线性计算复杂性。
2024-05-20 11:40:20
997
原创 论文精读-SRFormer Permuted Self-Attention for Single Image Super-Resolution
增加基于变压器的图像超分辨率模型(例如SwinIR)的窗口大小可以显着提高模型性能,但计算开销也相当大。在本文中,我们提出了一种简单而新颖的SRFormer方法,它可以享受大窗口自关注的好处,但引入的计算负担更少。我们的SRFormer的核心是排列自注意(PSA),它在自注意的渠道和空间信息之间取得了适当的平衡。我们的PSA简单,可以很容易地应用于现有的基于窗口自关注的超分辨率网络。
2024-05-19 16:04:06
1267
1
原创 论文精读-SUNet Swin Transformer UNet for Image Denoising
图像恢复是一个具有挑战性的病态问题,也是一个长期存在的问题。在过去的几年里,卷积神经网络(cnn)几乎统治了计算机视觉,并在包括图像恢复在内的不同层次的视觉任务中取得了相当大的成功。然而,最近基于Swin变压器的模型也显示出令人印象深刻的性能,甚至超过了基于cnn的方法,成为高级视觉任务的最先进方法。本文提出了一种以Swin Transformer层为基本块的复原模型SUNet,并将其应用于UNet结构中进行图像去噪。
2024-05-18 16:35:47
1326
原创 论文精读-SwinIR Image Restoration Using Swin Transformer
图像恢复是一个长期存在的低级视觉问题,其目的是从低质量图像(例如,低尺度、噪声和压缩图像)中恢复高质量图像。虽然最先进的图像恢复方法是基于卷积神经网络的,但很少有人尝试用变形金刚在高级视觉任务中表现出令人印象深刻的表现。在本文中,我们提出了一个基于Swin Transformer 的强基线模型SwinIR 用于图像恢复。SwinIR 包括三个部分:浅层特征提取、深层特征提取和高质量图像重建。
2024-05-18 11:35:43
1758
原创 论文精读-Transformer(Attention is All You Need)
Transformer 与 RNN 不同,可以比较好地并行训练。Transformer 本身是不能利用单词的顺序信息的,因此需要在输入中添加位置 Embedding,否则 Transformer 就是一个词袋模型了。Transformer 的重点是 Self-Attention 结构,其中用到的Q, K, V矩阵通过输出进行线性变换得到。
2024-05-11 11:38:00
846
原创 论文精读-存内计算芯片研究进展及应用
随着数据快速增长,冯诺依曼架构内存墙成为计算性能进一步提升的关键瓶颈。新型存算一体架构(包 括存内计算(IMC)架构与近存计算(NMC)架构),有望打破冯诺依曼架构瓶颈,大幅提高算力和能效。该文介绍了 存算一体芯片的发展历程、研究现状以及基于各类存储器介质(如传统存储器DRAM, SRAM和Flash和新型非易 失性存储器ReRAM, PCM, MRAM, FeFET等)的存内计算基本原理、优势与面临的问题。然后,以知存科技 WTM2101量产芯片为例,重点介绍了存算一体芯片的电路结构与应用现状。
2024-05-06 11:59:11
1865
原创 论文精读-ReTransformer ReRAM-based Processing-in-MemoryArchitecture for Transformer Acceleration
Transformer已经成为一种流行的深度神经网络(DNN)模型,用于神经语言处理(NLP)应用,并在神经机器翻译、实体识别等方面表现出优异的性能。然而,其在自回归解码器中的规模化点积注意机制在推理过程中带来了性能瓶颈。Transformer也是计算和内存密集型的,需要硬件加速解决方案。
2024-05-05 23:47:17
1215
3
原创 论文精读-CHARM Composing Heterogeneous AcceleRators for MatrixMultiply on Versal ACAP Architecture
密集矩阵乘法(Dense matrix multiply, MM)是深度学习应用中使用最多的核函数之一。为了应对这些应用的高计算需求,具有FPGA和专用ASIC加速器的异构架构已经成为有前途的平台。例如,AMD/赛灵思通用ACAP架构结合了通用CPU内核和可编程逻辑,以及针对AI/ML优化的AI Engine处理器。由400个AI Engine处理器组成的阵列以1ghz的频率运行,可为32位浮点(fp32)数据提供高达6.4 TFLOPs的性能。然而,机器学习模型通常同时包含大型和小型MM操作。
2024-05-04 13:28:08
1467
原创 论文精读-ViA A Novel Vision-Transformer AcceleratorBased on FPGA
自谷歌于2017年提出Transformer以来,它在自然语言处理(NLP)方面取得了重大进展。然而,不断增加的成本是大量的计算和参数。为了有效地处理NLP任务,前人针对FPGA中的变压器模型设计并提出了一些加速器结构。现在,Transformer的发展也对计算机视觉(CV)产生了影响,并在各种图像任务中迅速超越了卷积神经网络(cnn)。CV中使用的图像数据与NLP中的序列数据存在明显差异。这两个领域中包含变压器单元的模型中的细节也有所不同。数据方面的差异带来了局部性的问题。
2024-05-02 15:26:08
2191
2
原创 论文精读-基于FPGA的卷积神经网络和视觉Transformer通用加速器
针对计算机视觉领域中基于现场可编程逻辑门阵列(FPGA)的传统卷积神经网(CNN)络加速器不适配视 觉Transformer网络的问题,该文提出一种面向卷积神经网络和Transformer的通用FPGA加速器。首先,根据卷 积和注意力机制的计算特征,提出一种面向FPGA的通用计算映射方法;其次,提出一种非线性与归一化加速单 元,为计算机视觉神经网络模型中的多种非线性和归一化操作提供加速支持;然后,在Xilinx XCVU37P FP- GA上实现了加速器设计。
2024-05-01 13:04:16
3644
原创 CUDA架构介绍与设计模式解析
1CUDA 是 NVIDIA 于 2006 年推出的通用并行计算架构,经过多年发展,已成为 GPU 计算的重要标准。
2024-04-29 20:39:53
3966
2
原创 ubantu python完整安装示例(ubantu16.04 python3.7.1演示)、包含cmake完整安装流程(主要适用于arm linux机器)
本文主要介绍了ubantu python源码编译安装的完整流程(使用python3.7.1演示安装),同时也介绍了常规的安装方法。
2023-02-21 12:02:18
5115
2
原创 音乐推荐系统设计
移动网络和数字多媒体技术的飞速发展促进了数字音乐产业的共享与广泛传播.对用户而言,在海量的音乐库中寻找个人喜欢的音乐需要花费大量的时间和精力。音乐推荐系统的目的是将用户从这项繁琐的工作中解脱出来,从而有效地提高用户体验,为音乐平台创造经济收益。使用基于协同过滤的经典推荐算法,如矩阵因子分解方法,其数据的来源是用户的历史交互数据。协同过滤的应用非常广泛,但同时也面临着数据稀疏和冷启动等问题,同时,由于协同过滤的模型所限,在特征提取方面存在着很多不足,从而会限制推荐系统的准确率。音乐作为一种艺术形式,吸引用户、
2022-12-16 14:46:45
3291
1
原创 2022Flink大数据比赛项目-焦点科技大数据编程大赛
本文主要是针对有一定flink经验的同学,想巩固基础或者提升学习使用。本文解答也用了flink的大部分基础知识,像是窗口,状态编程,水位线,多流join等等,希望能给你带来一些启发。
2022-11-28 13:58:59
915
原创 解决from d2l import torch as d2l报pandas,numpy的相关问题
本文主要解决19 del hard_dependencies, dependency, missing_dependencies 21 # numpy compat---> 22 from pandas.compat.numpy import ( 23 np_version_under1p17 as _np_version_under1p17, 24 np_version_under1p18 as _np_version_under1p18,
2022-11-27 10:56:11
2779
原创 解决jupyter下载好了库,但无法使用的问题。以及补充jupyter如何下载新的库。
本文主要解决jupyter下载好了库,但是无法使用的问题。以及补充jupyter如何下载新的库。
2022-11-23 17:14:39
5884
转载 jupyter notebook密码配置
6.在第2步jupyter_notebook_config.py配置文件中找到“c.NotebookApp.password“(要去掉#号),等于刚生成的那个Hash密码sha1。1.windows下,打开命令行CMD窗口,重新生成一个jupyter配置文件,并给出了生成的文件位置。Enter password: #写入密码,密码不会显示。,设置明文密码XXXXXX,得到对应的Hash密码。,输入明文密码XXXXXX即可登陆。4.回到windows命令行,运行。
2022-11-20 15:10:07
5503
1
原创 高性能MPI编程实验
而MPI仅仅是一个并行计算标准,没有相应的分布式文件系统的支撑,在大数据场景下大文件的存储及访问都会成为一个问题,同时用户还需要考虑集群节点之间的通信协调、容错等问题,这些使得MPI的编程难度比较大,集群本身的规模也很难做到像MapReduce那样的超大规模。2.使用虚拟进程,虚拟进程(MPI_ PROC_ NULL)是不存在的假想进程,在MPI中的主要作用是充当真实进程通信的目或源,引入虚拟进程的目的是为了在某些情况下编写通信语句的方便。MPI是一种基于消息传递的并行编程技术,而不是一种具体的编程语言。
2022-10-20 00:00:00
1122
原创 详细介绍区块链发展-比特币,以太坊
本篇文章重点介绍了区块链1.0和2.0的核心技术(像智能合约,Ghost协议,Pow和Pos算法等)以及他们的典型应用比特币和以太坊。最后介绍了区块链目前在各行业的应用有哪些。
2022-10-17 17:30:13
668
原创 详解大中小数据常用数据库的SQL语句、函数以及常见优化
本篇文章主要介绍目前我在目前项目中使用过的一些数据库的用法,像关系型数据库Sql Server,大数据数据库Hive,Hbase。总体上,文章内容偏基础,适用于那些需要使用数据库做开发或者课程设计实践的同学。本文重点介绍了关系型数据库,大数据数据库实际会使用到的一些Sql语句,Sql函数,定时任务以及数据库调优等。
2022-10-16 11:59:26
474
原创 Flink SQL常见问题
首先是双流关联的大状态问题,FlinkSQL 的双流关联会保留左右流的历史数据来互相关联,需要关联的时间间隔越长,保存的历史数据就会越多,状态也就会越大。比如,要关联订单的下单事件和退款事件,并保证计算结果的正确性,需要考虑这两个事件发生的间隔,可能是一个月甚至更久。上图左侧是一个双流关联的有状态 SQL 作业,图中的 Mem 和 Disk 组成了 SQL 作业的 TaskManager 节点,SQL 作业状态后端使用 RocksDB,状态持久化在 HDFS 文件系统上。一开始我们尝试把 SQL 作业的状态
2022-06-28 18:17:47
1736
原创 快速幂(python实现)
前言使用快速幂的原因,针对高次幂计算,如果使用循环遍历的方法,时间开销比较大eg:8^10000000000 而使用快速幂的方法可以在O(log(次幂))的复杂度内完成。实现import timestart=time.time()p=1000000007def quick_count(a,b): sum=1 while b!=0: if b&1: sum=sum*a%p b>>=1 a*=
2022-03-19 13:21:14
3070
原创 优先级队列实现的两种方法(python实现)
关于优先级队列在python的最常用的两种方法(heapq和queue.PriorityQueue)。主要说明了优先级队列的创建,入队,出队,设置优先级,设置降序(即大顶堆)的方法。
2022-03-19 12:54:30
2578
原创 hbase建表,删表,修改,查询(get,scan,布隆过滤器)
hbase关于表使用的具体流程,涉及到表的创建,删除,修改,查询(get,scan,布隆过滤器)
2021-12-30 21:07:34
2142
原创 使用matplotlib做动态排名图
数据源数据过程:1.先将数据保存使用pandas的read_csv函数从网页端直接读取数据,并筛选部分数据url = 'https://gist.githubusercontent.com/johnburnmurdoch/4199dbe55095c3e13de8d5b2e5e5307a/raw/fa018b25c24b7b5f47fd0568937ff6c04e384786/city_populations'df = pd.read_csv(url, usecols=['name'
2021-12-20 14:33:19
542
原创 大数据存储项目-基于Flink的高速公路ETC入深圳数据实时分析平台
大数据项目总体流程分为以下4个方面:数据采集,数据存储与管理,数据处理与分析,数据解释与可视化。数据源下载 高速公路ETC入深圳数据,数据量:178396条https://opendata.sz.gov.cn/data/dataSet/toDataDetails/29200_00403621要求(1)每秒产生50+条数据,可以采用网络压力测试工具产生多点并发的高速数据流https://blog.youkuaiyun.com/moonpure/article/details/72674374,例如JMeter
2021-12-18 20:38:25
3676
6
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人