公共资源速递 This Weekly Snapshots !
5 个公共数据集:
* AF-Chat 音频对话文本数据集
* ArtVIP 机器交互式图像数据集
* Updesh 印度语合成文本数据集
* Medical Information 药品信息数据集
* Nemotron-Math-HumanReasoning 数学推理数据集
6 个公共教程:
* Self Forcing 实时视频生成
* MOSS:文本到口语对话生成
* PE3R:高效感知三维重建框架
* LFM2-1.2B:高效边缘部署的文本生成模型
* AudioBox-Aesthetics 音频美学评估 Demo
* Osmosis-Structure-0.6B:结构化输出的小语言模型
访问官网立即使用:openbayes.com
公共数据集
1. AF-Chat 音频对话文本数据集
AF-Chat 数据集包含约 7.5 万个多回合、多音频对话(平均 4.6 个片段和 6.2 个回合;范围为 2-8 个片段和 2-10 个回合),涵盖语音、环境声音和音乐。该数据集根据每个音频的源数据集划分为不同的子集(声音、音乐 4ALL、百万歌曲数据集,适用于虚拟助手、客服和其他需要情感识别与响应的对话系统。
* 在线使用:
https://go.openbayes.com/Ptvi3
2. ArtVIP 机器交互式图像数据集
ArtVIP 数据集包含 26

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



