GLM-Edge：面向端侧应用的大语言模型解决方案

计蕴斯Lowell

于 2025-04-03 09:23:05 发布

阅读量804

点赞数 17

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/gitblog_00095/article/details/146971562

GLM-Edge：面向端侧应用的大语言模型解决方案

GLM-Edge GLM Series Edge Models 项目地址: https://gitcode.com/gh_mirrors/gl/GLM-Edge

项目介绍

GLM-Edge 是一系列面向端侧应用的大语言模型，包括对话模型和多模态理解模型。这些模型经过特殊设计和优化，以适应移动设备、车机以及PC平台上的实时推理需求。GLM-Edge 系列包含四种不同规模的模型，分别为 GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B 和 GLM-Edge-V-5B。这些模型基于 GLM-4 系列，通过针对性调整，以实现性能与效率的最佳平衡。

项目技术分析

GLM-Edge 系列模型在技术上采用了混合量化方案，以及应用投机采样技术，显著提高了在端侧设备上的推理速度。例如，在高通骁龙8 Elite平台上，GLM-Edge-1.5B-Chat 和 GLM-Edge-V-2B 模型能够以每秒60 tokens以上的速度进行解码，而在应用投机采样技术后，速度可进一步提升至每秒100 tokens以上。此外，模型还支持多种后端推理方式，包括 Transformers、OpenVINO 和 vLLM，以满足不同场景和需求。

项目及技术应用场景

GLM-Edge 系列模型主要应用于端侧设备，如智能手机、车机和PC等，适用于以下场景：

移动设备上的智能助手：为移动设备提供快速响应的对话能力，实现即时交互体验。
车机系统中的自然语言交互：为车机系统提供自然语言处理能力，支持语音控制和信息交互。
PC平台上的多模态应用：在PC平台上实现图像识别和自然语言处理的结合，提供更丰富的用户体验。

项目特点

优化推理性能：通过混合量化和投机采样技术，模型在端侧设备上实现快速推理。
多平台兼容性：支持多种后端推理框架，适应不同硬件和操作系统。
易于部署：提供详细的安装和推理说明，便于用户快速部署和使用。
模型多样：提供不同规模和类型的模型，满足不同场景和应用的需求。

GLM-Edge 系列模型的推出，为端侧设备上的自然语言处理提供了高效、灵活的解决方案，特别是在移动设备和车机系统中，其快速响应和高效率的特点，将极大地提升用户体验。对于开发者而言，GLM-Edge 提供了易于部署和使用的模型，有助于快速构建基于自然语言处理的应用。

通过以上介绍，GLM-Edge 系列模型无疑是一个值得关注的端侧大语言模型解决方案。无论是对于开发者还是终端用户，它都提供了高效、灵活的自然语言处理能力，有望在未来的智能设备应用中发挥重要作用。

GLM-Edge GLM Series Edge Models 项目地址: https://gitcode.com/gh_mirrors/gl/GLM-Edge

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

计蕴斯Lowell 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。