- 博客(139)
- 资源 (6)
- 收藏
- 关注
原创 轻量级模型汇总解读——涉及MobileNet、ShuffleNet、GhostNet、EfficientNet、NasNet、轻量transformer
轻量级模型汇总解读,汇总目录
2024-09-14 11:49:25
2582
原创 深度学习模型服务端部署——flask+gunicorn+supervisor+nginx+docker
深度学习模型服务端部署,确保高并发,高可用,利用flask+gunicorn+docker+nginx部署。
2024-08-01 17:57:19
1424
DeepSeek系列模型及其部署方法与高性能服务配置
本文详细介绍了deepseek公司发布的大规模deepseek-V3和deepseek-R1模型,以及六个基于Transformer的蒸馏版本模型。涵盖了四种不同的部署方式——ollama的简易4-bit量化部署、动态量化版(.gguf文件)的部署、使用vllm和SGLang的性能优化部署。每种部署方式都配有具体的安装与操作指导。同时,本文还深入讨论了如何实现大模型的服务高并发部署,通过WSGI服务器如Gunicorn/uWSGI优化模型推理性能,以及结合批处理技术和多服务器负载均衡提升系统处理速度和扩展性。
适用人群:从事大规模机器学习研究和应用的专业人士及工程师,特别是希望部署和优化大型深度学习模型的人群。
使用场景及目标:帮助使用者理解并实现在本地或云端平台上高效部署和维护大型深度学习模型的方法和技术,确保模型能在实际业务环境中稳定可靠地提供服务;同时也探讨了一些高级话题如模型压缩与加速技巧,以及针对在线预测服务的架构设计。
其他说明:阅读时请注意不同硬件设备对各部署方式的支持情况,根据自身环境选择合适的技术栈进行实施。对于高并发场景,则重点参考文中提出的性能优化策略来构建健壮的服务平台。
2025-02-24
局部算子—matlab代码
提取图像的局部特征会用到局部算子,该资源包含一些常用的局部算子的实现方式,用matlab实现;包含lbp,eldp,oldp,ldn,ldp,ltp,灰度共生矩阵等。
2019-01-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人