大模型的第一天学习-LM studio的安装和本地大模型搭建

部署运行你感兴趣的模型镜像

一、下载安装,加载模型

  1. 直接在官网下载lm studio
  2. 将下载模型加载进来。可以通过hugging face下载模型,也可以直接拷贝。或者直接搜索“发现”

二、使用本地服务器

因为我对python和post链接熟悉一点,就打算使用python去链接lm studio来使用大模型,来实现本地化。

  1. 在“开发者”启动允许本地链接,并得到端口数据
  2. 在cmd钟输入ipconfig,得到ipv4地址
  3. 得到链接地址:http://localhost:1234/v1/chat/completions

在这里插入图片描述

下面是代码,要填入正确的ipv4和端口。( “top_k”: 10,“temperature”:0.9,。。。“max_tokens”: 30000,这些连七八糟的模型参数现在可以不加,不影响使用,以后慢慢来。。。)

import requests
url = "http://1.1.1.11:1234/v1/chat/completions"
data = {
   "model":"deepseek-r1-distill-llama-8b",
   "messages": [
                   {"role": "system", "content": "你是一个专业的助手。"},
                   {"role": "user", "content": f"""
对于email信息,可以按以下分类方法进行分类:类型:<会议通知><信息知会><待办事宜><问询>紧急程度:<紧急><优先><普通>
分级方法:
如果包括手机等个人信息,为4级,否则为1级。
以下是两份email,请进行分类分级:
张三:
昨天下午,2378号项目出现现场故障,针对此问题,我们将于今天下午两点在3号会议室开会讨论请按时参加。有关项目的信息,可以与李四联系,联系电话13912345678"""}
               ]
}

try:
   # 发送 POST 请求(无数据)
   response = requests.post(url,json=data)

   # 打印响应状态码和内容
   print("Status Code:", response.status_code)
   print("Response Body:", response.text)

except requests.exceptions.ConnectionError as e:
   print("连接失败,请确认:")
   print("- 目标服务器是否运行中")
   print("- 端口是否正确")
   print("- IP 地址是否正确")

三、模型参数的学习

  1. top_k (候选单词的个数)只有排名前k的词会被考虑
  2. top_p (概率)从模型的概率分布中抽样时,只会考虑累积概率达到top_p的那些词
  3. temperature 控制生成文本的随机性
  4. max_tokens 设置生成文本的最大长度
  5. frequency_penalty 正值减少高频词的出现
  6. presence_penalty 正值会惩罚重复出现的话题,鼓励探索新的主题

四、一些必要的知识

自回归生成:大语言模型是通过重复生成token序列(sequence)中的下一个token来运作的。每次模型想要生成另一个token时,会重新阅读整个token序列并预测接下来应该出现的token。

您可能感兴趣的与本文相关的镜像

ACE-Step

ACE-Step

音乐合成
ACE-Step

ACE-Step是由中国团队阶跃星辰(StepFun)与ACE Studio联手打造的开源音乐生成模型。 它拥有3.5B参数量,支持快速高质量生成、强可控性和易于拓展的特点。 最厉害的是,它可以生成多种语言的歌曲,包括但不限于中文、英文、日文等19种语言

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值