点击左上方蓝字关注我们

GTC 大会是NVIDIA每年最重要的发布平台之一,广纳当今计算领域最热门话题的相关培训和见解,并为广大开发者创造与顶级专家交流的机会。
2021 年 4 月 12 日至 16 日,NVIDIA以线上的形式举办了GTC21,NVIDIA 创始人兼首席执行官黄仁勋于北京时间 4 月 13 日上午 9:00 以在线直播的形式发表了主题演讲,同时,来自AI、数据中心、网络、图形以及自动驾驶汽车等领域的业界领袖共带来了1,600 多场演讲。

应NVIDIA邀请,百度飞桨生态产品负责人王运凯在GTC上带来了《前沿的深度学习框架设计理念及GPU性能优化技巧》的演讲,为大家介绍了飞桨框架2.0各项重大更新,包含全新的动静整合编程方式、全新设计的高层 API、改良后的大规模稀疏参数服务器等内容。同时分享针对 GPU 性能的两种优化策略,包含如何透过独家的混合精度运算策略,充分发挥 Tensor Core+FP16 的性能加速效果,达到相比 FP32 接近 4 倍的运算速度;以及在 NLP 相关模型应用场景中借助深度整合 TensorRT 中的 Multi- Head Attention Plugin 及动态变长等手法,达成在 ERNIE 等模型上超过 3 倍的性能优化。

点击文末“阅读原文”或以下链接立即观看演讲:
https://gtc21.event.nvidia.com/media/State-of-the-Art%20DL%20Framework%20Design%20and%20GPU-Specific%20Performance%20Optimization%20%5BS32800%5D/1_qe1a6ski/206675143
最后,如果对GTC上的技术分享意犹未尽 想进一步了解怎么在Paddle框架上提升GPU的部署性能, 欢迎扫下方二维码报名下周一(4/19)、二(4/20) 晚上19:00-20:00 飞桨b站直播,我们会由资深工程师分享更多技巧。

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台,包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件,持续开源核心能力,为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台,针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。
END

本次演讲介绍了飞桨框架2.0的重大更新,包括全新的编程方式、API设计以及大规模稀疏参数服务器等内容。并分享了两种GPU性能优化策略:混合精度运算策略和深度整合TensorRT技术。
1824

被折叠的 条评论
为什么被折叠?



