10分钟自己动手搭建一个免费的大语言模型

  • 0.下载LM Studio:

  • 1.查找/下载模型

  • 2.查看已经下载的模型

  • 3.聊天

  • 4.配置服务端,供其他程序调用

    • 4.1 支持的接口:
    • 4.2 使用postman调用接口

LM Studio 是一款专为本地运行大型语言模型(LLM)而设计的桌面应用程序,其主要作用是简化用户在本地环境中部署和使用这些先进的人工智能模型的过程。LM Studio 允许用户无需互联网连接即可在本地设备上运行复杂的语言模型,从而保障数据隐私和处理速度

LM Studio 的优点包括:

  1. 离线运行能力:用户可以在没有网络连接的情况下使用该平台,确保数据隐私和安全性。

  2. 用户友好的界面:LM Studio 提供直观的操作界面,使得即使是 AI 领域的新手也能轻松上手。

  3. 多平台支持:LM Studio 支持 Windows、Mac 和 Linux 系统,兼容多种硬件配置

    img

  4. 广泛的模型兼容性:LM Studio 支持从 Hugging Face 等流行仓库下载多种流行的 LLM 模型,如 Llama、MPT 和 StarCoder 等。

  5. 高性能和优化:LM Studio 采用了先进的计算架构和高效的算法优化,确保模型在本地设备上的高效运行。

  6. 隐私保护:LM Studio 不收集、监控或存储用户数据,所有操作都在本地完成,避免了云端数据传输的风险。

  7. 灵活的使用方式:用户可以通过内置聊天界面或本地服务器调用模型 API,灵活地与模型进行交互,并且可以同时运行多个模型。

0.下载LM Studio:

https://lmstudio.ai/

1.查找/下载模型

点击左侧的“发现”按钮,打开搜索页面

img

输入关键字,寻找想要下载的模型,这边找一下Qwen的模型,找到Qwen2 0.5B的模型,

模型的名称为:Qwen2-0.5B-Instruct-GGUF

0.5B的模型是千问系列最小的模型,对于设备的要求较低

模型名称的含义:

qwen2.5-0.5b-instruct-q5_k_m.gguf

  • qwen2.5: 模型的名称,千问2.5
  • 0.5b: 参数数量,b表示billion,0.5B表示5亿参数,参数数量较少,通常是小型模型,适合资源受限的设备或较小规模的任务,可以用在移动设备、嵌入式系统
  • Instruct: 经过指令(问答)优化微调,让模型更擅长遵循用户给出的明确指令,避免不必要的冗余或不相关内容
  • Q5_K_M: 是一种让模型更小、更快、更省资源的技巧,简单理解为“压缩+优化”的方法;Q5比Q3信息表示能力更强,通常能够保留更多模型的原始精度
  • GGUF: 一种大模型文件格式,原始的大模型预训练结果经过转换后变成GGUF格式可以更快地被载入使用,也会消耗更低的资源。

img

点击右下角Download开始下载

img

2.查看已经下载的模型

点击“我的模型”按钮,可以找到当前已经下载的所有模型

img

3.聊天

点击“聊天”页面,选择刚才下载的模型:Qwen2-0.5B-Instruct

img

随便说点什么,由于使用的0.5B参数的小模型,速度非常快

img

4.配置服务端,供其他程序调用

点击“开发者”按钮,配置服务端

1.选择一个已有的模型,如刚下载的Qwen2-0.5B-Instruct

2.启动服务

img

服务启动完成

img

  • Server Port: 设置本地服务器使用的网络端口。默认情况下,LM Studio 使用端口 1234。如果该端口已被占用,您可能需要更改此设置
  • 启用 CORS: (跨源资源共享)允许您访问的网站向 LM Studio 服务器发起请求。从网页或 VS Code / 其他扩展程序发起请求时可能需要启用 CORS
  • 在局域网内提供服务: 是否允许来自网络中其他设备的连接。如果未选中,则服务器仅监听本地主机。
  • 记录提示与响应: 是否在本地服务器日志文件中记录提示和/或响应。
  • Just-in-Time Model Loading: 启用后,如果请求指定了一个未加载的模型它将被自动加载并使用。此外,"/v1/models"端点还将包括尚未加载的型号。

4.1 支持的接口:

GET http://198.18.0.1:1234/v1/models: 列出当前加载的模型

POST http://198.18.0.1:1234/v1/chat/completions: 聊天补全。将聊天历史发送给模型以预测下一个助手响应

POST http://198.18.0.1:1234/v1/completions: 文本补全模式。根据给定的提示预测下一个token(或多个)。注意:OpenAI 认为此端点已’弃用’。

POST http://198.18.0.1:1234/v1/embeddings: 文本嵌入。为给定的文本输入生成文本嵌入。接受字符串或字符串数组。

4.2 使用postman调用接口

请求聊天接口:http://localhost:1234/v1/chat/completions

请求内容:

{   
    "model": "Qwen2-0.5B-Instruct",
    "messages": [
      { "role": "system", "content": "你是一个导游,对于旅游行程会安排的非常详细" },
      { "role": "user", "content": "我要去北京旅游,应该怎么安排" }
    ],
    "temperature": 0.7,
    "max_tokens": -1,
    "stream": false
}

返回:

{
    "id": "chatcmpl-adfbckpfw1rc8mw21ejb18",
    "object": "chat.completion",
    "created": 1731940884,
    "model": "qwen2-0.5b-instruct",
    "choices": [
        {
            "index": 0,
            "message": {
                "role": "assistant",
                "content": "根据您的要求,我可以为您规划一个参观北京故宫、天坛公园和颐和园的路线。这样既方便又安全,便于您参观游览。\n\n1. **北京故宫**:这是中国最著名的皇家宫殿之一,位于北京市中心。您可以乘坐地铁或者公交前往。\n2. **天坛公园**:这里是中国古代皇家园林的代表,不仅风景优美,还有许多景点供您观赏。\n\n3. **颐和园**:位于昆明湖畔,是世界文化遗产,有“万园之园”之称。\n\n您可以根据自己的时间安排选择不同的游览方式。在出发前,请确保您的出行日期与行程相符,并做好旅行中需要的个人物品准备。\n\n希望这个计划对您有所帮助!"
            },
            "logprobs": null,
            "finish_reason": "stop"
        }
    ],
    "usage": {
        "prompt_tokens": 32,
        "completion_tokens": 150,
        "total_tokens": 182
    },
    "system_fingerprint": "qwen2-0.5b-instruct"
}

img

LM Studio后台输出调用日志:

img

如何零基础入门 / 学习AI大模型?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高

那么我作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,希望可以帮助到更多学习大模型的人!至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

👉 福利来袭优快云大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈

全套AGI大模型学习大纲+路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

read-normal-img

640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈
基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉 福利来袭优快云大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈

img

这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值