
性能分析
文章平均质量分 97
本专栏以深度神经网络模型训练、推理过程的性能分析为主,主要包括一些结构或算子的计算量分析、内存/显存分析。
张小殊.
主要发文方向为深度学习、并行编程、大规模并行训练、模型推理优化,欢迎大家一起互相学习、交流,谢谢!
展开
-
全连接层及其注意力attention的参数量和计算量分析
本篇文章对liner和Multi-Head Attention以及其他常见结构的参数量和计算量进行分析,以及对自动计算模型参数量和计算量的工具库ptflops进行简单介绍。原创 2023-11-20 10:02:41 · 10518 阅读 · 5 评论 -
卷积算子参数量和计算量分析(普通卷积、深度可分离卷积、分组卷积)
在用于计算机视觉任务的深度神经网络模型中,卷积算子作为一种重要的特征提取方式被广泛应用,本文针对常见的卷积算子参数量和计算量的计算方法进行分析,主要包括普通卷积、深度可分离卷积、分组卷积。原创 2023-11-13 11:19:33 · 9300 阅读 · 7 评论 -
硬件加速器及其深度神经网络模型的性能指标理解
现如今,深度神经网络模型和硬件加速器,如GPU、TPU等的关系可谓是“不分彼此”,随着模型参数的增加,硬件加速器成为了训练、推理深度神经网络不可或缺的一个工具,而近年来硬件加速器的发展也得益于加速人工智能模型的训练和推理。作为在人工智能领域最重要的两个基件,即模型(算法)和硬件(算力)(人工智能三个核心要素:算法、算力、数据),我们有必要去理解每种基件的评价指标以及指标的意义,才能在应用的过程中去选择适合的模型和硬件,而不是去挨个尝试!原创 2023-11-02 09:19:09 · 9348 阅读 · 6 评论