自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 【Datawhale AI夏令营】学习笔记——语音生成赛 Baseline 深度分析与进阶优化

本文针对语音合成赛题进行分析,提出优化方案。首先指出基线方案的优缺点:优点在于自然度高、结构清晰,但存在反欺诈适应性不足、音色克隆精度有限等问题。建议从三方面改进:1)模型升级,采用WavLM/HuBERT等先进编码器;2)数据增强,加入噪声等训练;3)多策略融合,建立梯队模型系统。重点强调需提升音色还原度、内容准确性和抗检测能力,推荐使用VALL-EX等先进模型,并引入音频后处理和韵律迁移技术。通过模型融合与对抗训练,在保证语音质量的同时增强反欺诈性能。最终形成兼顾音色相似度、自然度和稳定性的完整解决方案

2025-08-13 21:40:27 582

原创 【Datawhale AI夏令营】2025 全球 AI 攻防挑战赛(语音生成方向)——学习笔记

2025全球AI攻防挑战赛聚焦智能语音生成与检测对抗,要求根据参考音频生成高仿真的目标说话人语音。技术核心涉及TTS系统架构、说话人嵌入提取、风格迁移和条件生成方法,需解决零样本克隆、多维度风格复现等难点。比赛强调生成语音需同时满足自然度要求和防伪检测规避能力,通过对抗训练提升模型欺骗率。参赛方案需平衡音色相似度、情感表达与反检测特性,利用扩散模型等技术优化声学特征生成,最终产出能突破现有防伪系统的语音样本。

2025-08-10 20:50:26 290

原创 【Datawhale AI夏令营】学习笔记

缺点:缺乏上下文理解能力、聚类不适合非凸形结构。优点:资源需求低、快速验证。

2025-07-13 22:33:57 299

原创 【Datawhale 春训营】AI+新能源 Task 2 学习笔记

Baseline中仅简单删除含缺失值的行,实际竞赛可采用插值、分箱、标准化等方法。Baseline 提供了从数据读取、探索、清洗、特征工程、模型训练到结果提交的一整套流程;:结合气象原理与业务场景,构造更多高阶特征(如日照角度、相对湿度、前滞特征等)。:提取和构造更能反映问题规律的新特征,例如风速合成、时间特征、变量间比值等。通过作图、统计量等手段,了解特征与目标值的分布、周期性、相关性和异常值。实际竞赛中可考虑:缺失值插补、异常值剔除、分箱、归一化/标准化等方法。

2025-04-19 16:25:08 729 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除