基于英特尔至强融核的Caffe深度学习框架构建
1. 引言
近年来,随着芯片制造技术的进步,CPU计算能力不断达到新的峰值,同时加速卡的出现也让整体计算能力更上一层楼。这为科学、医学、气候研究等领域提供了强大的计算支持。除了广为人知的GPU,至强融核(Xeon Phi)也是一个不错的选择,因为尽管GPU通用性强,但CUDA编程语言学习难度较大。
深度学习框架是近年来人工智能领域发展迅速的方向。神经网络的最早概念可追溯到1943年Warren McCulloch和Walter Pitts提出的神经元数学模型。传统神经网络技术通过随机分配权重,并使用递归操作逐个校正权重,以最小化整体错误率。但由于当时计算能力不足,这一技术未能持续发展。得益于计算机芯片的快速发展,深度学习再次成为广泛研究和应用的科学项目。
本文在英特尔至强融核平台上实现了Caffe深度学习框架,并通过矢量化、并行化和OpenMP等优化功能,提高了性能并减少了学习时间。具体工作目标如下:
- 使用LeNet MNIST分类模型测量Caffe深度学习框架在训练和测试数据中的准确性。
- 比较英特尔至强E5 - 2650和英特尔至强融核7210在英特尔优化前后的数据集执行时间。
- 比较两个英特尔至强E5 - 2650节点和两个英特尔至强融核7210节点的多节点执行结果。
2. 背景知识与相关工作
2.1 背景知识回顾
- 至强融核处理器 :英特尔至强融核系列基于多集成核心(MIC)架构,提供了多核架构所不具备的高性能计算能力。MIC架构将多个英特尔处理器核心集成在单个芯片上,使
超级会员免费看
订阅专栏 解锁全文
1935

被折叠的 条评论
为什么被折叠?



