某中心协助举办合成数据生成研讨会
在2021年5月7日举办的ICLR 2021虚拟会议上,首届合成数据生成研讨会成功举行。合成数据是解决数据稀缺和隐私风险的有效方案:在标注数据有限时,合成数据可扩充训练集以减少过拟合;在隐私保护场景中,数据管理者可共享合成数据而非原始数据,既保护用户隐私又保留数据效用。尽管这两种场景面临质量与公平性等相似技术挑战,但通常被分开研究。本次研讨会旨在深化对两种场景下合成数据生成挑战的理解。
研讨会组织与内容
研讨会由学术界和工业界研究人员联合组织,涵盖隐私、公平性、医疗健康和机器学习鲁棒性等领域。活动包括邀请报告、投稿报告、海报展示和小组讨论,汇聚了多样化的研究者和实践者。
七场邀请报告主题:
- 机器学习能否革新医疗?合成数据或是答案
- 图像合成的生成模型
- 使用生成对抗网络实现差分隐私合成数据生成
- 金融合成数据的前景
- 深度生成模型的偏见与泛化
- 音乐生成的生成建模
- 生成式AI的伦理考量
七篇重点论文口头报告:
- 合成数据用于模型选择
- GAN集成生成合成训练数据
- 通过张量幻觉实现少样本学习
- 利用公共数据实现实用私有查询发布
- 快速、公平和私密的数据生成
- 通过医学图像生成克服数据共享障碍
- GAN加剧面部数据偏见的隐患
技术应用与研究方向
研讨会聚焦机器学习与隐私保护的交集,涉及生成对抗网络(GANs)、差分隐私技术及数据增强方法。合成数据生成不仅提升模型性能,还在医疗、金融等领域推动数据共享与伦理实践。活动以小组讨论和颁奖仪式结束,强调了跨学科合作的重要性。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码

521

被折叠的 条评论
为什么被折叠?



