先验+注意力:信号处理界的“万能催化剂”!

关注gongzhonghao【学术鲸】,解锁更多SCI相关咨询!

超声静默说话、星际文明搜寻、音高精准捕捉——三大前沿任务看似风马牛不相及,却被同一种思路串联:把传统信号处理的“硬规则”与深度学习的“软注意力”联姻。

无论是Conformer把全局自注意塞进超声舌动-语音映射,实现感知质量秒杀CNN;还是SETI@home调用百万志愿者GPU,用123 000条Doppler漂移率做相干积分,锁定外星窄带信号;抑或SLASH借可微DSP先验给自监督模型装上“绝对音高导航仪”,一举刷新噪声鲁棒基频估计——它们都证明:当小波、DSP等物理先验遇见注意力机制,模型就能在复杂噪声中抓到真正的关键特征。

这种“先验+注意”的组合拳,不仅在学术排行榜上屡破SOTA,也为故障诊断、深空通信、智能语音等工业场景提供了即插即用的升级方案,堪称信号处理界的“万能催化剂”。

Conformer-based Ultrasound-to-Speech Conversion

方法:

使用 UltraSuite-TaL80 四位说话人的同步超声-音频数据,将 64×128 的超声帧序列输入 Conformer Base 或 Conformer-bi-LSTM 网络,映射为 80 维 mel 频谱,再经预训练 HiFi-GAN 合成语音;训练采用 AdamW 与余弦重启调度,仅用 20 epoch 并早停,最终通过 MSE、MCD 与 27 人 MUSHRA 主客观评估验证性能。

图片

创新点:

  • 提出将卷积增强的 Transformer(Conformer)引入 UTIF-to-mel 映射,首次验证其在静默语音接口中的有效性。

  • 在 Conformer 之后插入两层 bi-LSTM,形成双流时空建模,显著提升感知自然度。

  • 整个系统参数更少、训练更快,却能在主观听感上超越传统 2D-CNN,为实时 SSI 部署打开新路径。

图片

论文链接:

https://arxiv.org/pdf/2506.03831

关注gongzhonghao【学术鲸】,获取先验+注意力的最新选题和idea~

 SETI@home: Data Acquisition and Front-End Processing

方法:

前端用Arecibo及Parkes、GBT等站记录1.42 GHz附近的2.5 MHz带宽双极化复基带数据,经硬件/软件雷达消隐后由splitter分频分段时间切片生成工作单元;客户端对每个9.7 kHz子带执行15档DFT分辨率、123 000漂移率的相干积分,先基线平滑去宽带干扰,再在功率-时间-频率立方体内并行运行五类检测器并给出概率分数,结果回传服务器;后端通过RFI清洗与多重一致性筛选得到候选信号并安排FAST重测,整套流程已在6×10^23次浮点运算中验证。

图片

创新点:

  • 首创志愿计算范式,将Arecibo 2.5 MHz基带数据切片成107 s工作单元并通过互联网分发给>10^5台PC,实现万台级并行相干积分。

  • 提出123 000阶Doppler漂移率相干搜索框架,覆盖±100 Hz s⁻¹,首次让地外行星或卫星加速信号也能被锁定在单个DFT通道内。

  • 设计五类信号(spike/Gaussian/pulse/triplet/autocorrelation)联合检测算法,搭配RFI自动剔除与概率打分,使系统可同时捕捉窄带连续、脉冲、重复波形等多种技术签名。

图片

论文链接:

https://arxiv.org/pdf/2506.14718

关注gongzhonghao【学术鲸】,获取先验+注意力最新选题和idea~

SLASH: Self-Supervised Speech Pitch Estimation Leveraging DSP-derived Absolute Pitch

方法:

SLASH以CQT作为输入,由Pitch Encoder输出F0概率矩阵与带噪非周期度,在训练阶段先用DSP先验与音高一致性损失约束绝对/相对音高,再用可微DSP模块将预测的F0、谱包络和非周期度重构成伪频谱,通过L1能量距离反向优化F0,同时对语音进行随机噪声与音量增强并计算多任务鲁棒损失,最终在LibriTTS-R和MIR-1K上取得优于传统DSP、SSL基线的音高与清浊精度。

图片

创新点:

  • 提出用子谐波求和生成帧级绝对音高先验分布,作为SSL训练的“音高指南”,显著缓解纯相对学习目标带来的绝对误差。

  • 设计可微DSP“伪频谱”生成器,跳过波形合成直接从F0产生周期谱,使得F0能通过梯度下降端到端优化而不再受局部极小困扰。

  • 引入广义能量距离与噪声鲁棒损失,联合优化周期/非周期分量与清浊判决,使系统在0 dB白噪下的RMSE几乎不变。

图片

论文链接:

https://arxiv.org/pdf/2507.17208

► 论文发表难题,一站式解决!

TURING

选题是论文的第一步,非常重要!

但很多学生找到了热门的选题,却卡在代码和写作上!可见论文要录用,选题-idea-代码-写作都缺一不可!

图灵学术论文辅导,汇聚经验丰富的实战派导师团队,针对计算机各类领域提供1v1专业指导,直至论文录用

关注gongzhonghao【学术鲸】,解锁更多SCI相关咨询!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值