mobile-deep-learning

最新推荐文章于 2025-12-03 20:31:34 发布

转载最新推荐文章于 2025-12-03 20:31:34 发布 · 182 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/jianfeifeng/p/11040694.html

文章标签：

#人工智能

本文讨论了现代深度学习框架移植到移动端的问题及优化方法，重点分析了CPU与GPU优化策略、算法路径选择及轻量化部署等问题。

部署运行你感兴趣的模型镜像

　　现代框架移植到移动端问题不大，caffe2在支持facebook应用需要的layer以及全protobuf情况下小于1MB，核心大概在100多kb，看起来和mdl一致。

　　移动端最重要问题是如何优化。绝大多数数学库优化是针对server或者GPU来做的，移动端可以跑但是跑不快。

　　需要着重考虑的点：

　　1、是否有CPU优化？是否使用NEON？是否有为mobile设计的thread pool？是否有针对CPU框架做超参数的调整（thread number）？

　　2、算法上是否采用了正确的path，比如用Winograd来做卷积，对小矩阵做特殊优化（类似xsmm）等？

　　3、GPU上是否有高效的kernel implementation?如OpenCL/GL, Metal等。

　　4、是否有在mobile上非常有用的功能，如reduced precision。

　　深度学习系统的重量级优化和轻量级部署如何平衡融合？

　　编译优化和执行端分离，直接在优化端进行内存的分配部署，直接把方案保存下来。执行端不再进行内存分配算法，直接按照保存的方案执行即可。在编译优化端打包所需op，舍弃不需要的op，使得执行端更加轻量。

转载于:https://www.cnblogs.com/jianfeifeng/p/11040694.html

您可能感兴趣的与本文相关的镜像

Kotaemon

AI应用

Kotaemon 是由Cinnamon 开发的开源项目，是一个RAG UI页面,主要面向DocQA的终端用户和构建自己RAG pipeline

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

aimeng1608

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

48.现有移动端开源框架及其特点—MDL（mobile-deep-learning）

大勇若怯任卷舒

04-13

576

刚刚，阿里开源首个深度学习框架 X-Deep Learning！

阿里技术

12-21

1739

刚刚，阿里妈妈正式对外发布了X-Deep Learning(下文简称XDL)的开源代码地址，开发者们可以在Github上自主下载。此前，在11月底，阿里妈妈就公布了这项开...

参与评论您还未登录，请先登录后发表或查看评论

Mobile-deep-learning（MDL）

人工智能

09-25

1227

Mobile-deep-learning（MDL） Free and open source mobile deep learning framework, deploying by Baidu. This research aims at simply deploying CNN on mobile devices, with low complexity and hi

mobile-deep-learning（MDL）百度移动端深度学习框架

明月的博客

09-28

1371

2017 年 9 月 25 日，百度在 GitHub 开源了移动端深度学习框架 mobile-deep-learning（MDL）的全部代码以及脚本，希望这个项目在社区的带动下能够更好地发展。 GitHub 地址：https://github.com/baidu/mobile-deep-learning 移动端应用深度学习的难点一直以来由于技术门槛和硬件条件的限制，在移

百度开源移动端深度学习框架mobile-deep-learning（MDL）

weixin_34344677的博客

09-25

643

作者｜李永会编辑｜Natalie2017 年 9 月 25 日，百度在 GitHub 开源了移动端深度学习框架 mobile-deep-learning（MDL）的全部代码以及脚本，希望这个项目在社区的带动下能够更好地发展。写在前面深度学习技术已经在互联网的诸多方向产生影响，每天科技新闻中关于深度学习和神经网络的讨论越来越多。深度学习技术在近两年飞速发展，各种互联网产品都争相应用深度学习技术，产...

计算机视觉深度学习训练推理框架

小白学视觉

05-07

1027

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达前言本文整理了一些深度学习训练推理框架，涉及计算机视觉、语音、时序任务上的框架，共计20多种。1训练框架PytorchPyTorch是由Facebook人工智能研究小组开发的一种基于Lua编写的Torch库的Python实现的深度学习库，也是目前使用范围和体验感最好的一款深度学习框架。它的底层基于Torch，但实现与运用全部是...

深度学习模型移植的移动端框架

It is me 的博客

07-30

796

下面列出各大公司使用的CNN库：各主流移动端深度学习框架诞生时间如下： 2017 年 3 月，XMART LABS 在 GitHub 上开源 Bender 2017 年 4 月 19 日，Facebook 在 F8 开发者大会上推出 Caffe2 (已并入 PyTorch) 2017 年 5 月 17 日，在 Google I/O 2017 大会上，移动端深度学习框架 TensorFlow Lite 诞生 2017 年 6 月 6 日，苹果在 WWDC 大会上推出 Core ML 2.

精选资源

Mobile-DeepLearning-in-TensorFlow-Lite:TensorFlow Lite中有关移动深度学习的演示

05-14

简介这是一个基于Google移动端深度学习框架TensorFlow Lite开发的并最终部署在Android手机上的项目代码参考以下资源功能主要实现了物体检测的功能，使用者打开APP可通过摄像头拍照，APP会对拍得的图片进行识别，...

Model-Based-Deep-Learning-for-Low-Cost-IMU-Dead-Reckoning-of-Wheeled-Mobile-Robot-main

03-19

- 文献《Model-Based Deep Learning for Sensor Fusion and Localization》深入探讨了理论基础及其实际部署策略[^5]。 - GitHub 上有许多类似的课题分享，例如 `https://github.com/username/deep-imu-dr` 提供了一...

Deep-Q-Learning-SON-Perf-Improvement-master.zip

07-18

# Deep-Q-Learning-SON-Perf-Improvement The requirement for running this code is to obtain license and access of the Vienna LTE-A simulator, found at: ...

【Deep Learning】Github上关注最多的53个深度学习项目

Mlib

08-12

1万+

Top Deep Learning ProjectsA list of popular github projects related to deep learning (ranked by stars).Last Update: 2016.08.09 Project Name Stars Description TensorFlow 29622 Computation usi

移动端开源框架

qq_17127427的博客

03-22

402

NCNN １、开源时间：2017年7月　　　２、开源用户：腾讯优图　　　　３、GitHub地址：https://github.com/Tencent/ncnn QNNPACK 全称：Quantized Neural Network PACKage（量化神经网络包）　　　１、开源时间：2018年10月　　　２、开源用户：Facebook　　　　３、GitHub地址：ht...

移动深度学习 Mobile-deep-learning（MDL）

TensorFlowNews

09-25

1539

Free and open source mobile deep learning framework, deploying by Baidu.This research aims at simply deploying CNN on mobile devices, with low complexity and high speed. It supports calculation on iOS

AI开发者看过来，主流移动端深度学习框架大盘点

麦峰强的博客

12-14

3263

简书作者 dangbo 在《移动端深度学习展望》一文中对现阶段的移动端深度学习做了相关展望。作者认为，现阶段的移动端 APP 主要通过以下两种模式来使用深度学习： online 方式：移动端做初步预处理，把数据传到服务器执行深度学习模型，优点是这个方式部署相对简单，将现成的框架（Caffe，Theano，MXNet，Torch) 做下封装就可以直接拿来用，服务器性能大, 能够处理比较大的模型...

TensorRT笔记（5）：研究timingCache

ouliten的博客

12-02

929

在里出现了大量的timingCache，但是当时没有取研究这是干啥的，本文就来解析一下。样例都基于上面的文章。

大模型应用：大模型 MapReduce 全解析：核心概念、中文语料示例实现.12

minhuan的专栏

12-03

1052

本文介绍了MapReduce编程模型及其在大模型训练中的应用。MapReduce通过"分治-并行-聚合"思想处理大规模数据，传统Hadoop MapReduce侧重结构化数据计算，而大模型MapReduce则针对自然语言处理任务。文章详细对比了两者在架构、处理对象和核心算力等方面的差异，并提供了中文词频统计的Python实现示例，包括单机版和分布式版本。分布式实现利用多进程模拟集群计算，展示了数据分片、Map、Shuffle和Reduce的完整流程。

07_Spring AI 干货笔记之提示词

在科技的浪潮中，我们寻找着创新的火种，在代码的海洋里，我们编织着智慧的网。腾飞开源，就是这样一个由技术精英汇聚而成的博客平台，我们致力于分享在Java、Python、IoT和人工智能等领域的最新研究成果和实战经验。在腾飞开源的博客上，你会看到紧跟技术前

11-30

1847

本文详细介绍了Spring AI中的提示词核心概念与API设计。提示词作为引导AI模型生成特定输出的关键输入，其结构从简单字符串演进为包含多角色消息的复杂形式。Spring AI通过Prompt和Message接口提供结构化提示词管理，支持系统、用户、助手等角色分配。PromptTemplate类实现动态内容渲染，并支持自定义模板引擎。文章还涵盖提示词工程的最佳实践与令牌机制，为开发者提供完整的提示词设计解决方案。

昇腾平台 vLLM 部署与性能优化实战：高吞吐推理落地指南