gunicorn给worker分配GPU

janelu9

已于 2023-09-25 15:07:46 修改

阅读量926

点赞数 2

CC 4.0 BY-SA版权

文章标签： gunicorn flask transformer

于 2023-08-30 16:46:24 首次发布

本文链接：https://blog.youkuaiyun.com/lujian45/article/details/132585652

博客介绍了在gunicorn的config文件（myconfig.py）中添加配置代码，并提及启动服务相关内容，涉及gunicorn、flask和transformer等信息技术领域元素。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在gunicorn的config文件(myconfig.py)中添加如下配置代码：

import os
import time

try:
    import pynvml 
    pynvml.nvmlInit()
    gpuDeviceCount = pynvml.nvmlDeviceGetCount()
except:
    gpuDeviceCount = 1
    
gpuDevicePool = []

def pre_fork(server, worker):
    try:
        gid = gpuDevicePool.pop(0)
    except:
        gid = (worker.age - 1) % gpuDeviceCount
    worker.gid = gid

def post_fork(server,worker):
    time.sleep(worker.age % server.cfg.workers)
    os.environ['CUDA_VISIBLE_DEVICES'] = str(worker.gid)
    server.log.info(f'worker(age:{worker.age}, pid:{worker.pid}, cuda:{worker.gid})')
    
def child_exit(server, worker):
    gpuDevicePool.append(worker.gid)

启动服务：

gunicorn -c myconfig.py server:app -w 16

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

janelu9

关注关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

记一次性能优化的心酸历程【Flask+Gunicorn+pytorch+多进程+线程池，一顿操作猛如虎】

码农飞哥

11-13

3万+

性能优化不是CV大法就能解决的

TritonServer中加载模型，并在Gunicorn上启动Web服务调用模型

笔者从事电信媒体开发多年，愿意将多年的开发经验分享给同行

11-24

199

本文详细介绍了如何在TritonServer中加载模型，并在Gunicorn上启动Web服务调用模型。通过TritonServer的高性能推理能力和Gunicorn的Web服务器功能，可以轻松地实现深度学习模型的部署和在线推理服务。希望本文对读者在实际应用中有所帮助。

1 条评论您还未登录，请先登录后发表或查看评论

gunicorn+flask+EDGE部署（多进程、多gpu）

qq_53930200的博客

05-28

460

2、gunicorn 参数文件 gunicorn.py。3、执行代码, 开启 6个进程、1、推理主函数：run.py。

[译] 通过优化 Gunicorn 配置提高性能

张伟的专栏

12-15

1417

[译] 通过优化 Gunicorn 配置提高性能 weixin_33877092 2019-05-25 04:56:03 1505 收藏 3 文章标签： python 运维数据库最后发布:2019-05-25 04:56:03首次发布:2019-05-25 04:56:03 原文链接：https://juejin.im/post/5ce8cab8e51d4577523f22f8 版权原文地址：Better performance by optimizing Gunicorn c

利用flask写的接口(base64, 二进制, 上传视频流)+异步+gunicorn部署Flask服务+多gpu卡部署

智障变智能

09-17

3920

一.flask写的接口 1.manage.py启动服务这里要注意的是用docker的话,记得端口映射 #coding:utf-8 import base64 import io import logging import pickle from flask import Flask, jsonify, request from PIL import Image from sklearn...

Gunicorn Worker（进程） Thread （线程）配置建议

weixin_38553042的博客

09-02

8541

只保留一个worker，并增加该worker中的线程数线程比进程更轻量级(更少的内存消耗)，一worker，多线程，Gunicorn将确保程序可以接收多个请求。由于worker是多线程的，所以它能够处理N个请求。既然这样，为什么我需要更多的worker? 要回答这个问题，假设我需要对百度返回的搜索结果做一些工作。例如，我可能还想为每个结果查询计算一个质数。现在我正在计算我的工作负载，我碰到了python的全局解释器锁的问题。即使我有N个线程，一次也只有一个线程可以处理结果。这意味着要获得真正的

online_http_pytorch:Gunicorn aiohttp PyTorch，一个并发的HTTP服务器，以便使用PyTorch进行推理

05-08

Gunicorn Aiohttp PyTorch ... 如果在GPU服务器上运行，它将为每个工作人员（进程）分配一个GPU（由Gunicorn授权）。您可以在app.sh文件（-w $ num_worker）中分配worker的数量。跑步 sh app.sh

Gunicorn与Aiohttp结合PyTorch构建并发HTTP服务器

在本项目中，GPU将为每个Gunicorn worker分配，以支持并行计算。接下来，我们探讨"online_http_pytorch"项目的核心功能和工作原理： - 并发HTTP服务器：利用Gunicorn和aiohttp构建的HTTP服务器可以处理并发请求，...

香侬科技Service Streamer：加速深度学习Web服务、极大提高GPU利用率。| 百万人学AI评选

weixin_37986590的博客

05-30

1539

2020 无疑是特殊的一年，而 AI 在开年的这场”战疫“中表现出了惊人的力量。站在“新十年”的起点上，优快云【百万人学AI】评选活动正式启动。本届评选活动在前两届的基础上再度升级，设立了「AI优秀案例奖Top 30」、「AI新锐公司奖Top 10」、「AI开源贡献奖Top 5」三大奖项。我们相信，榜样的力量将成为促进AI行业不断发展的重要基石，而优快云将与这些榜样一起，助力AI时代的”新基建“。活动官网：https://bss.youkuaiyun.com/m/topic/ai_selection/in...

seamless-m4t-v2-large transformers 使用gpu推理

脚印

12-18

1837

transformers gpu

基于gunicorn+flask进行深度学习模型部署（使用onnxruntime框架进行模型推理加速做核心的计算，同时本项目还支持多GPU部署）

最新发布

03-04

Gunicorn-配置详解

chf的博客

11-26

337

原文链接：https://blog.youkuaiyun.com/y472360651/article/details/78538188

Nginx+Gunicorn(开启多worker)运行Django/Flask应用程序时关于共享内存（全局变量）的注意事项

bocai_xiaodaidai的博客

04-22

3780

关于单例模式：问题：单例模式在本地测试时一切正常，当运行在生产环境下，单例不生效，会创建出多个实例。原因：Django/Flask本地环境的runserver为单进程多线程，单进程下当然共享一份内存，而在生产环境的多worker下，每个进程都有自己的内存空间，因此也有自己的实例。关于全局变量：同样的问题，在生产环境中，多个worker之间是无法共享一个全局变量的，一个work...

关于django中几个重要的gunicorn worker的配置

weixin_48232453的博客

08-27

2778

深度学习多进程GPU部署（二）- 深度学习部署

weixin_42010722的博客

10-22

6141

下面针对使用多台裸机使用分布式的场景提供指导，总体而言，强烈推荐使用 docker 环境部署使用分布式训练当机器数量多于 5 台且长期使用时，建议使用 Kubernetes 部署或其他类似集群管理工具使用。

Gunicorn的使用手册看这篇就够了

wuyy0224的博客

12-10

1万+

本文详细介绍了Gunicorn的安装使用以及各个配置参数的含义。希望对读者朋友们有所帮助。针对这些的学习还是看官方文档最好。

Gunicorn性能优化：提升Python Web应用的服务效率

uncle_ll的博客

01-30

2363

通过合理配置Gunicorn，可以显著提升Python Web应用的性能。无论是CPU密集型还是I/O密集型应用，都有对应的优化策略

Gunicorn-使用详解