Django+Celery部署TensorFlow模型

最新推荐文章于 2023-03-08 21:19:35 发布

原创

最新推荐文章于 2023-03-08 21:19:35 发布 · 1.3k 阅读

3 ·

CC 4.0 BY-SA版权

本文介绍了如何利用Django和Celery部署TensorFlow模型，解决在异步任务中如何分配GPU资源避免显存爆满以及如何防止模型重复加载的问题。通过设置Celery任务队列和并发数，实现GPU资源的有效利用。同时，通过全局变量处理模型预加载和推理，确保模型只加载一次，简化了多GPU环境下的模型管理。

Django作为基本的Web框架，Celery用来处理异步任务，两者搭建分析服务器部署TensorFlow模型。（数据服务器通过POST请求与分析服务器进行任务发布和结果接收，这里不是重点。）在这里主要记录一下解决的两个问题：

1.我在utils.py中写好了TensorFlow的模型预测代码，我每次调用执行utils.py这个代码的时候，我想在不同的卡上执行。

出发点是为了充分利用celery处理异步任务的效率，因为每次模型推理的时候模型参数都需要加载到GPU中，如果不可以通过制定任务使用的GPU来合理分配资源，GPU肯定会爆显存。

解决办法是利用celery的任务队列特性，通过开启多个任务worker，然后在开启的时候制定使用的GPU，再对celery中的启动参数【-c】（也就是concurrency，表示最大并行子进程数目）进行合理的配置，就可以做到既不会爆显存，又可以让服务器上的GPU都利用起来。

CUDA_VISIBLE_DEVICES=0 nohup python manage.py celery worker -E -l info -n analyze --maxtasksperchild 100 -c 1 -Q analyze_task >analyze0.log 2>&1 &
CUDA_VISIBLE_DEVICES=1 nohup python manage.py celery worker -E -l info -n analyze --maxtasksperchild 100 -c 1 -Q analyze_task >analyze1.log 2>&1 &
CUDA_VISIBLE_DEVICES=2 nohup python manage.py celery worker -E -l info -n analyze --maxtasksperchild 100 -c 1 -Q analyze_task >analyze2.log 2>&1 &
CUDA_VISIBLE_DEVICES=3 nohup python manag

最低0.47元/天解锁文章

4 条评论

梅川鸡尾酒 2022.03.23
博主，celery可以用gpu么？感觉加载后并没有利用到gpu
- 梅川鸡尾酒回复vector_Lu 2022.03.24
  博主说的对，是自己在数据加载时没有加载到cuda上。
- vector_Lu回复梅川鸡尾酒 2022.03.23
  有没有用GPU和celery没有关系吧？celery只是负责启动异步任务，具体你的有没有用GPU得看你的任务实现的时候用没用上。

北风之神c 2021.11.01
写得赞，博主用心了，但主要还是celery太难用了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字，所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图，因为与一下6点关系很大。 1) 整个项目目录结构,celery的目录结构和任务函数位置，有很大影响 2) @task入参 ,用户有没有主动设置装饰器的入参 name,设置了和没设置有很大不同，建议主动设置这个名字对函数名字和所处位置依赖减小 3) celery的配置，task_queues(在3.xx叫 CELERY_QUEUES )和task_routes (在3.xx叫 task_routes) 4) celery的配置 include （在3.xx叫 CELERY_INCLUDE）或者 imports (3.xx CELERY_IMPORTS) 或者 app.autodiscover_tasks的入参 5) cmd命令行启动参数 --queues= 的值 6) 用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 https://function-scheduling-distributed-framework.readthedocs.io/zh_CN/latest/index.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等19个方面全方位超过celery，任何方面都是有过之而无不及。发布性能提高1000%，消费性能提高2000%