GTC21大会飞桨专家演讲实录：前沿的深度学习框架设计理念及GPU性能优化技巧...

转载于 2021-04-16 21:15:34 发布 · 225 阅读

CC 4.0 BY-SA版权

原文链接：https://gtc21.event.nvidia.com/media/State-of-the-Art%20DL%20Framework%20Design%20and%20GPU-Specific%20Performance%20Optimization%20%5BS32800%5D/1_qe1

文章标签：

#人工智能 #编程语言 #大数据 #深度学习 #css

本次演讲介绍了飞桨框架2.0的重大更新，包括全新的编程方式、API设计以及大规模稀疏参数服务器等内容。并分享了两种GPU性能优化策略：混合精度运算策略和深度整合TensorRT技术。

点击左上方蓝字关注我们

GTC 大会是NVIDIA每年最重要的发布平台之一，广纳当今计算领域最热门话题的相关培训和见解，并为广大开发者创造与顶级专家交流的机会。

2021 年 4 月 12 日至 16 日，NVIDIA以线上的形式举办了GTC21，NVIDIA 创始人兼首席执行官黄仁勋于北京时间 4 月 13 日上午 9:00 以在线直播的形式发表了主题演讲，同时，来自AI、数据中心、网络、图形以及自动驾驶汽车等领域的业界领袖共带来了1,600 多场演讲。

应NVIDIA邀请，百度飞桨生态产品负责人王运凯在GTC上带来了《前沿的深度学习框架设计理念及GPU性能优化技巧》的演讲，为大家介绍了飞桨框架2.0各项重大更新，包含全新的动静整合编程方式、全新设计的高层 API、改良后的大规模稀疏参数服务器等内容。同时分享针对 GPU 性能的两种优化策略，包含如何透过独家的混合精度运算策略，充分发挥 Tensor Core+FP16 的性能加速效果，达到相比 FP32 接近 4 倍的运算速度；以及在 NLP 相关模型应用场景中借助深度整合 TensorRT 中的 Multi- Head Attention Plugin 及动态变长等手法，达成在 ERNIE 等模型上超过 3 倍的性能优化。

点击文末“阅读原文”或以下链接立即观看演讲：

https://gtc21.event.nvidia.com/media/State-of-the-Art%20DL%20Framework%20Design%20and%20GPU-Specific%20Performance%20Optimization%20%5BS32800%5D/1_qe1a6ski/206675143

最后，如果对GTC上的技术分享意犹未尽想进一步了解怎么在Paddle框架上提升GPU的部署性能, 欢迎扫下方二维码报名下周一(4/19)、二(4/20) 晚上19：00-20：00 飞桨b站直播，我们会由资深工程师分享更多技巧。

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础，是中国首个开源开放、技术领先、功能完备的产业级深度学习平台，包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件，持续开源核心能力，为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台，针对企业级需求增强了相应特性，包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业，提供零门槛、预置丰富网络和模型、便捷高效的开发平台；BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。

END