LM Studio本地离线部署大语言模型

原创已于 2024-05-29 18:20:57 修改 · 1.4w 阅读

·

5

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2024-04-14 15:12:11 首次发布

AI 专栏收录该内容

33 篇文章

订阅专栏

Qwen3-VL-30B

Qwen3-VL-30B

图文对话

Qwen3-VL

Qwen3-VL是迄今为止 Qwen 系列中最强大的视觉-语言模型，这一代在各个方面都进行了全面升级：更优秀的文本理解和生成、更深入的视觉感知和推理、扩展的上下文长度、增强的空间和视频动态理解能力，以及更强的代理交互能力

LM Studio本地离线部署大语言模型

使用LM Studio快速体验大模型工具，免除Python环境及众多依赖组件的安装。可以切换不同类型的大语言模型，同时支持在windows、linux、mac等PC端部署。

1. 环境配置

本次使用的操作系统及硬件信息如下：

操作系统：windows11 23H2
CPU: intel i7-12700
MEM: 16GB
GPU: NVIDIA GeForce GTX 1650
Disk： 512GB SSD

已经安装nvidia显卡驱动+cuda+cudnn，配套如下：

2. 安装LM Studio

访问官网，选择windows版本下载安装。

安装完成打开后的界面如下：

3. 模型配置

以首页推荐的谷歌deepmind出品的模型Google’s Gemma 2B Instruct为例，点击搜索会跳转到huggingface官网改模型的URL：

https://huggingface.co/lmstudio-ai/gemma-2b-it-GGUF

直接使用lmstudio下载模型会失败，本文采用离线部署模式。

3.1 访问huggingface官网或镜像站点，下载模型文件

huggingface官网：

https://hf-mirror.com/lmstudio-ai/gemma-2b-it-GGUF

镜像站点：

https://hf-mirror.com/lmstudio-ai/gemma-2b-it-GGUF/tree/main

3.2 导入模型文件

下载模型文件后按照如下目录层级放置到本地路径

本地路径查询如下，LM Studio-Mymodel-show in File Explorer

4. 运行模型

4.1 AIChat-选择模型加载

选择上述导入的模型。

可以设置默认prompt或使用当前系统prompt：

默认启用了GPU：

4.2 chat对话测试

模型加载完毕后即可进行对话测试：

4.3 local server

除了UI界面的chat对话使用之外，也可以在本地启动服务器，使用接口进行调试。包括curl、python等方式。

您可能感兴趣的与本文相关的镜像

Qwen3-VL-30B

Qwen3-VL-30B

图文对话

Qwen3-VL

Qwen3-VL是迄今为止 Qwen 系列中最强大的视觉-语言模型，这一代在各个方面都进行了全面升级：更优秀的文本理解和生成、更深入的视觉感知和推理、扩展的上下文长度、增强的空间和视频动态理解能力，以及更强的代理交互能力

5 条评论

QxQ么么 2025.08.04
仅支持gguf和xml格式的是么，不是这两个格式的是不是还需要自己转换格式?

gyf的blog 2024.10.12
那是两个模型吗其他文件也需要下载吗
- lldhsds回复gyf的blog 2024.10.16
  一个模型，都需要下载的

qq_42323141 2024.08.21
能把下载下来的给个网盘链接吗，直接下太慢了，还经常断
- lldhsds回复qq_42323141 2024.08.30
  需要哪个模型文件？

博客等级

码龄11年

185
原创

3072
点赞

2872
收藏

2141
粉丝

关注

私信

TA的精选

新 H3C UIS Cell 3020 G3服务器更换raid卡安装ONEStor记录
435 阅读
新使用dig查看dns递归查询过程
650 阅读
热使用Poste搭建内网邮件服务器
15716 阅读
热 ModelScope系列之开发环境安装
9258 阅读
热内存性能测试工具
8738 阅读

大家在看

TA的历史创作历程

分类专栏

服务器 2篇
存储 13篇
kubernetes 57篇
AI 33篇
容器 4篇
devops 6篇
Python 18篇
测试架构师 6篇
网络 4篇
虚拟化 8篇
Windows
Linux 20篇
云计算 34篇
数据系统 6篇

展开全部收起

上一篇：: CentOS升级默认git版本

下一篇：: iperf,netperf,sockperf网络性能测试实战

AI算力推荐

Qwen3-VL-30B

Qwen3-VL是迄今为止 Qwen 系列中最强大的视觉-语言模型，这一代在各个方面都进行了全面升级：更优秀的文本理解和生成、更深入的视觉感知和推理、扩展的上下文长度、增强的空间和视频动态理解能力，以及更强的代理交互能力

图文对话

Qwen3-VL

目录

展开全部

收起

评论 4

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

lldhsds 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。