基于Python的嵌入式并行平台上AI性能及Raft与Zookeeper对比
基于Python的嵌入式并行平台上AI性能
在嵌入式并行平台上使用Python进行AI计算时,不同计算任务和不同向量规模下有着不同的性能表现。
1. 函数计算误差
- Sigmoid函数 :当计算输入值范围在
[-5, +5],输出值范围在[0, 1]的向量的Sigmoid函数时,均方根误差约为0.0015。 - Tanh函数 :当计算输入值范围在
[-5, +5],输出值范围在[-1, +1]的向量的Tanh函数时,均方根误差约为0.0031。
2. Tanh计算性能
| 向量规模 | 节点数量 | 性能表现 |
|---|---|---|
| 约1000 | 1个节点 | 单个节点花费的时间比其他数量(>1)的节点花费的时间少约2倍。这意味着对于较小的向量规模,通信延迟带来的开销比并行计算带来的性能提升更大。 |
| ≥10000 | 8个节点 | 8个节点花费的时间总是最少的,平均比其他情况快4. |
超级会员免费看
订阅专栏 解锁全文
933

被折叠的 条评论
为什么被折叠?



